投稿元:
レビューを見る
初版を読んだ。些細ではあるが、たまに誤字がある
Unixのシェル{コマンド,スクリプト}を初学する人にとっても良い本
普通のプログラミング (主にR言語) に関しては多少心得がある人向け
そういえばよく考えると、データサイエンスをタイトルに冠してる割にはデータ分析自体のテクニックよりはその前後の処理にほとんどを費やしている
そういう意味ではもしかしたらがっかりされるのかも
投稿元:
レビューを見る
データ分析を行う上で、初物のデータを扱う時は、試行錯誤し「当たりをつける」工程が必要となる。ここをコマンドラインで行おうという提案。
UNIX系OSを扱える人なら、かなりいけます。修論執筆時にこの本に出会えていれば、楽ができたのに、、、orz
投稿元:
レビューを見る
コマンドラインを使って、
データロード→クレンジング→整形→解析処理→可視化
といった流れを勉強するために買った本。
Vagrantを使って仮想環境を構築し、
その中に必要なプログラムやデータセットを入れて、
動かす流れになっているので、すごく作業しやすかった。
コマンドラインだけでもかなりの分析が出来ることが
分かったことは正直かなり勉強になった反面、
実際のデータは目で終えるほどの量ではないので、
欠損値やノイズチェックのアタリのつけ方等を学ぶ手順も
本当はあってもいいのかなって少し思いました。