評価指標入門～データサイエンスとビジネスをつなぐ架け橋

著者著者：高柳慎一 , 著者：長田怜士 , 監修：株式会社ホクソエム

（概要）「評価指標でXXXという最高のスコアが出た！」と喜び勇んで、機械学習モデルが出力してくる予測結果をもとにビジネスを運用したとします。ところが、ビジネス上のKPI...

電子書籍

評価指標入門～データサイエンスとビジネスをつなぐ架け橋

税込 2,992 円 27pt

カートに入れる

ワンステップ購入

ワンステップ購入とはワンステップ購入とは

ほしい本に追加（値下がりすると通知がきます）

ご利用中のデバイスが対応しているかご確認ください

ブラウザ
iOS
Android
Win
Mac

対応デバイスごとのコンテンツタイプやファイルサイズヘルプ

オンライン書店e-honで紙の本を見る

+

商品説明

（概要）

「評価指標でXXXという最高のスコアが出た！」と喜び勇んで、機械学習モデルが出力してくる予測結果をもとにビジネスを運用したとします。ところが、ビジネス上のKPIと相関が高い評価指標を選んでいなかったために、KPIの推移を見てみると大した変化がありませんでした。あるいは「毎日夜遅くまで残業をして、特徴量生成とクロスバリデーションによって評価指標を改善しました！」というデータサイエンティストがいたとします。ところが、KPIの改善のためにはそこまで高い評価指標の値を達成する必要ありませんでした。このようなケースでは、データサイエンティストが費やした工数がすべて水の泡となってしまいます。
----------（はじめにより）----------

このような状況が起きてしまう背景にはさまざまな原因が考えられますが、あえて一言で言うと「データサイエンスの問題が解くべきビジネスの問題と乖離していた」ためです。

機械学習モデルの”良し悪し”を決めるときには、評価指標（Evaluation Metrics）を必要とします。本質的に評価指標の設計方法は自由であり、ビジネス上の価値を考慮して自ら作成することも可能です。RMSEやAUCといったスタンダードなものから、ドメインに特化した数値まで、あらゆる指標が評価指標になりえます。では評価指標はどのように決めるのが良いのでしょうか。また、どのように決めれば冒頭のような悲しい状況を生まずに済むのでしょうか。

本書はこれらの疑問に答えるため、機械学習の良し悪しを決める評価指標を軸に、解くべきビジネスの問題をどうやってデータサイエンスの問題に落とし込むのか、その原理を解説していきます。この原理が普遍的なものであれば、ビジネスがどんなものであっても応用できると考えることができます。

回帰、分類で使用するスタンダードな評価指標についても、基本から丁寧に解説します。本書を読むことで、どのようなケースでどの評価指標を選ぶべきかがわかり、評価指標の読み間違いを避けることができます。

（こんな方におすすめ）

・日々、評価指標に思いを馳せている方

（目次）

1章評価指標とKPI

　　1.1 機械学習と評価指標

　　1.2 機械学習と最適化計算

　　1.3 機械学習プロジェクトの流れ

　　1.4 評価指標とは

　　1.5 評価指標とKPIと目的関数の関係

　　1.6 評価指標の決め方を間違えないために

　　1.7 KPIの特質を損失関数と評価指標に反映する

　　1.8 まとめ

2章回帰の評価指標

　　2.1 回帰とは

　　2.2 データセットと回帰モデルの準備

　　2.3 平均絶対誤差

　　2.4 平均絶対パーセント誤差

　　2.5 二乗平均平方誤差

　　2.6 対数平均二乗誤差

　　2.7 モデルの評価

　　2.8 真に使うべき評価指標

　　2.9 その他の評価指標

　　2.10 まとめ

3章二値分類における評価指標

　　3.1 二値分類と評価指標

　　3.2 データセット

　　3.3 混同行列

　　3.4 正解率

　　3.5 マシューズ相関係数

　　3.6 適合率

　　3.7 再現率

　　3.8 F1-score

　　3.9 G-Mean

　　3.10 ROC-AUC

　　3.11 PR-AUC

　　3.12 pAUC

　　3.13 Employee Promotion Dataデータセットの評価

　　3.14 ビジネスインパクトの期待値計算

　　3.15 コスト考慮型学習

　　3.16 まとめ

4章多クラス分類の評価指標

　　4.1 多クラス分類とは

　　4.2 データセット

　　4.3 混同行列

　　4.4 正解率

　　4.5 適合率

　　4.6 再現率

　　4.7 F1-score

　　4.8 ROC-AUC

　　4.9 最適な評価指標の考察

　　4.10 まとめ