投稿元:
レビューを見る
1章 はじめに
Python,この本のなかで使用するライブラリの概要
インストールとセットアップ
2章 Pythoin,IpythontpJupyter Notebook
読み飛ばし
3章 Python組み込みのデータ構造と関数、ファイルの扱い
読み飛ばし
4章 Numpyの基礎:配列とベクトル演算
読み飛ばし
5章pandas入門
さすがに開発者だけに詳しい。ix記法が非推奨になっている。
6章 データの読み込み、書き出しとファイル形式
read_csvが一番良く使う
7章 データのクリーニングと前処理
map関数が一番良く使う。map関数に辞書型データを渡すとデータの置換ををやってくれるのは知らなかった。7-3 文字列操作も役立ちそう
8章 データラングリング:連結、結合、変形
SQL風のマージとかを紹介してあった。本当のPostgreSQLと比較するとやはり見劣りはするがそこそこ使える。
9章 プロットと可視化
matplotlibをいちいち起動してPlotするより数倍ラク
10章 データの集約とグループ演算
10-1-1
にあるグループobjectを辞書に変換する方法はしたなかった。dict(list(df.groupby('key1')))
マルチインデックスでもグルーピングができるのは便利。
11章 時系列データ
再サンプリングは便利。窓関数はだいぶ整理され使いやすくなった。
12章 Pandas:応用編
カテゴリ型変数は使ったことがないが使えるようになりたい。
13章 Pythonにおけるモデリングライブラリ入門
高度な話題であった
14章 データ分析の実例
こんなこともできるの実例です
訳者補記が親切
かなり詳しく載っているた。これ以上になるとオンラインのマニュアルを読むしかない(https://pandas.pydata.org/)
投稿元:
レビューを見る
かなり濃い内容になっており、基礎から実践まで幅広く書かれているのが良かった。
実際に自分で使ってみないとイメージしづらい部分が多いので、手元でJupyterを起動させながら見ていった方が良いなと思った。
投稿元:
レビューを見る
データの前処理あたりで必要そうなnumpy, pandas周りのテクニックを中心にかなり広範にわたって解説している。
おおよそpythonでデータ解析をしている人なら知っていることかもしれないが、たまにこういう本を読むと知識の抜けに気づくことがあるので、読む価値あり。
特に、各種演算についてより高速な方法の解説が所々書いてあるのが参考になった。
投稿元:
レビューを見る
python本は「独習プログラマー」「pythonスタートブック」「pythonユーザーのためのJupyter実践入門」に続いて四冊目。アプリ開発ではなく、データの分析用にpythonを使いたいので本書に取り組んだ。
データの前処理と加工に使うLibraryの解説。Numpy, Pandas, Matplotlibを重点的に解説している。この後の発展としてちょっとだけScipyとScikit-Learnにも触れている。
既存のツールに不満を持ち、pandasプロジェクトに参加した開発者自らが分かりやすく、順を追って例を示してくれる。元クオンツ(超が付くほどの実務家)というバックグランドをもつ方なので、まさに実践への導入である。
投稿元:
レビューを見る
ちょっとした調べ物ならネットの方が断然早い。
が、体系的な知識を得ようと思ったら本の方がやはり良い。
Pandasの辞書として持ってる意味はある。