「honto 本の通販ストア」サービス終了及び外部通販ストア連携開始のお知らせ
詳細はこちらをご確認ください。
紙の本
現場で使える!pandasデータ前処理入門 機械学習・データサイエンスで役立つ前処理手法 (AI&TECHNOLOGY)
機械学習やデータサイエンスの現場において、データ処理に必要な定番のライブラリ「pandas」。前処理の基本と様々な前処理手法について解説する。初学者向けに、基本操作方法や...
現場で使える!pandasデータ前処理入門 機械学習・データサイエンスで役立つ前処理手法 (AI&TECHNOLOGY)
現場で使える!pandasデータ前処理入門 機械学習・データサイエンスで役立つ前処理手法
05/16まで通常4,180円
税込 2,926 円 26ptこのセットに含まれる商品
前へ戻る
- 対象はありません
次に進む
商品説明
機械学習やデータサイエンスの現場において、データ処理に必要な定番のライブラリ「pandas」。前処理の基本と様々な前処理手法について解説する。初学者向けに、基本操作方法やデータ構造からしっかり学ぶことができる。【「TRC MARC」の商品解説】
機械学習エンジニア&データサイエンティスト必携!
初学者でもpandasによる前処理手法がわかる
【本書の背景】
機械学習やデータサイエンスでは、いかに「きれいなデータ」を用意できるかが非常に重要です。データクレンジングともいわれますが、実際の現場のデータは、機械学習やデータ分析にすぐ利用できるデータは皆無に等しく、エンジニアによりデータの前処理が必須となってきています。
【本書の概要】
本書は、機械学習やデータサイエンスの現場では、データ処理に必要な定番のライブラリ「pandas」を用いて、前処理の基本と様々な前処理手法について、あますところなく解説した書籍です。
初学者向けにシンプルでわかりやすいサンプルを用いていますので、pandasの基本操作方法やデータ構造、さらに前処理の基本の理解についてもしっかり学ぶことができます。
pandasを理解することで、様々な機械学習・データ分析タスクがスムーズに行えるようになります。
【本書の対象読者】
・機械学習エンジニア(初学者)
・データサイエンティスト(初学者)
【著書からひとこと】
機械学習では「Garbage In, Garbage Out(略、GIGO)」と言う概念があります。これは「無意味な(ゴミのような)データを入力すると無意味な結果が戻される」の意味です。
GIGOの概念でも解る通り、機械学習エンジニアは様々な手法で収集された膨大なデータの分析を行い、意味のある結果を得るために、多種多様な手法の前処理/分析を行います。
機械学習において約7割の時間はデータの前処理に費やされると言われていますが、その多くは「pandas」を使ったものです。
CSVファイルの読み込みから始まり、要約統計量や欠損値・外れ値・重複データの確認、さらにデータのマージやグループ化などの様々なタスクをpandasで行います。
本書では機械学習「初学者向け」にpandasの基本的な操作を解説しています。初歩的な要約統計量の算出やグループ化やダミー変数、さらに文字列や時系列データの基本操作など、幅広い範囲をカバーしています。
日々、データを業務で取り扱う機械学習エンジニアやKaggle等のデータ分析競技をやられている方に向けて、pandasを使ったデータ前処理のお役に立てばと思い執筆いたしました。
【商品解説】
目次
- Chapter 1 pandasの概要とPythonの基本操作
- 1.1 機械学習の分野でなくてはならないライブラリ「pandas」
- 1.2 pandasを利用する環境の構築
- 1.3 Pythonのデータ構造
- 1.4 Pythonの基本操作
- 1.5 Jupyter Notebookの基本操作
- Chapter 2 pandasのデータ構造
- 2.1 シリーズ
- 2.2 データフレーム
関連キーワード
あわせて読みたい本
前へ戻る
- 対象はありません
次に進む
この著者・アーティストの他の商品
前へ戻る
- 対象はありません
次に進む
紙の本
Pythonでのデータ処理で必携ライブラリであるpandasを知れる本!
2022/02/01 22:56
0人中、0人の方がこのレビューが役に立ったと投票しています。
投稿者:jintan - この投稿者のレビュー一覧を見る
Pythonを独学で学んで行く中で、Pythonでのデータ処理に使われる幾多のライブラリの中で、何について広く浅く知識を得ておくと良いものは何か?
色々と自問自答した結果、pandasが一番重要であると感じ、当書を購入。
日本語説明がお硬く、やや読みづらく感じますが、ショートコードとその実行結果が必ず書かれており、コードを読めばどういう動作をするのか解りますので、Pythonの入門書を何冊か読んでいるような方であれば問題ないです。
pythonでデータ分析をしている方なら、本書を読めば、データ処理必携ライブラリであるpandasをより活用できるようになると思います。