投稿元:
レビューを見る
機械処理・深層学習に必要な前処理の説明(機械学習、深層学習はわずかに説明あり、しかしメインではない)
今までの本では機械学習本に含まれていた処理を特化して取り上げている。
1章 データ分析・活用を始めるために
省略
2章 データ分析のプロセスと環境
本書の概要と実行環境(Google Colaboratory)の導入
データとjupyter notebook
3章 構造化データの前処理
まず、よくデータを診ましょう、データの型、個数、可視化、統計量把握など。欠損値の扱いはとても大事。
文字列データをカテゴリ変数により数値化
決定木手法で機械学習。
4章 構造化データの前処理(2)
数値を正規化(範囲変換、Z変換) してより機械学習しやすようにする。
階層型クラスタリング、非階層型クラスタリングにより教師なし学習。
5章 画像データの前学習
画像を読み込んでグレースケール化、2値化画像に変換する方法、ノイズ除去のためのモルフォロジー変換。
深層学習のためのデータ準備。画像の水増しのための画像反転、平滑化、明度変更など。
6章 時系列データの前処理
時系列データ特有の何分ごと、何時間ごとの集計作業(合計または平均など)の処理、読み取る期間をずらしながら集約するrolling関数の紹介。
k-NN法による異常検知、オートエンコーダによる異常検知。
7章 自然言語データの前処理
Janomeを使った形態素解析。単語文章行列の作成。
RNN(再帰型ニューラルネットワーク)のためのデータ準備として単語のインデックス化。
単語の共起ネットワークのためのデータ準備としてコサイン類似度の計算