セイバーマトリクス
2023/09/09 11:22
0人中、0人の方がこのレビューが役に立ったと投票しています。
投稿者:福原京だるま - この投稿者のレビュー一覧を見る
最近の野球では様々な指標が使われており、その値が何を意味するかは知っていてもどう算出するかは知らないなんてことも多かったが本書ではその指標がなぜ必要とされたのか、どう算出するのかが解説されておりわかりやすい
「セイバーメトリクス」で野球が面白くなった
2024/11/13 17:11
0人中、0人の方がこのレビューが役に立ったと投票しています。
投稿者:ふみちゃん - この投稿者のレビュー一覧を見る
「セイバーメトリクス」やRSAA、wRAA、UZR、UBRという新しい指標が出てきて、2番バッターは犠打が得意で、4番バッターはチーム一番の主軸という概念が覆されて、大谷が1番や2番を打つ時代かあ
0人中、0人の方がこのレビューが役に立ったと投票しています。
投稿者:エムチャン - この投稿者のレビュー一覧を見る
二刀流について読みたくて、読み始めましたが、投手心理や、犠牲バント、そして、打率……。どれも、なるほど、と思えました。二刀流は、それほどでも、なかったかな……。でも、野球好きにはいいと思います
投稿元:
レビューを見る
<目次>
序章 セイバーメトリクスの歴史
第1章 セイバーメトリクスの原理
第2章 投手の指標
第3章 打者の指標
第4章 セイバーメトリクスの可視化
第5章 パークファクター
第6章 守備の指標
第7章 走塁の指標
第8章 総合指標
第9章 セイバーメトリクスの革命
第10章 プロ野球の未解決問題
<内容>
セイバーメトリクスを一つ一つ歴史から中身まで解説した本。統計学の範疇なので細かいところの数式は理解できなかったが、まあシビアな数字でプロ野球選手は評価され、そこを基にゲームを組み立て、シーズンを戦っているのかと思うと、体力だけではないんだな、と思う。ただ「おわりに」でイチローのエピソードが載るが、「だんだん頭を使わなくなる」というコメントに著者は否定的だが、こうしたデータを覆すような選手の発想は必要なのではないか?とイチローの肩を持ってしまった。
投稿元:
レビューを見る
【はじめに】
MLBを見ていると、本当にたくさんの統計データが参照される。OPSやWHIPなど昔はまったく使われなかった数字も今では当たり前になってきた。特にStatcastが導入されて以来、打球角度や速度といったこれまでには得られなかったデータで解説されて楽しい。この統計データを駆使した野球は、セイバーメトリクスと呼ばれ、その効果を活用したアスレチックスの躍進を描いた『マネーボール』が有名だ。今ではどのチームも統計データを駆使しているので、そういった知識の差によるマージンを得られる余地は少なくなっているようだ。確かにここまで分析されたのであれば、その通りだろうということが分かる本。
確かに昔から勝利数や打点は所属チームの強さにも大きく依存するため選手を評価する指標としては不公平だということは思っていた。本書は、そういった影響を排除して選手の能力や成果を評価するための統計データの発展が非常に詳しく解説されている。MLBが好きな人は、より深く愉しむために読まれるべき本である。さすがブルーバックスとも言える。
ちなみにkindle版で読んだのだが、横書き縦スクロール方式で読みやすかった。これからこういう本も増えてくると嬉しい。
【概要】
■ プレーの得点価値
基本的にはプレーをどの程度得点につながるのかの「得点価値 (Run Value)」に直して評価するというのがセイバーメトリクスの基本である。様々なシチュエーション (無死一塁や二死満塁など)の得点期待値が数値化されている。その考え方からバントの価値などが評価され、現代野球では送りバントの頻度が大きく下がっているのだ。
その打者の打席前後の得点期待値の差と打席での得点を評価したRE24(Run Expectancy based on the 24 base-out stats)という指標は本書で初めて知ったが、打者の評価として非常に公平なのではないかと思った。
こういう公平な評価が可能な指標を次々と考え出すところに面白さがある。
■ 投手編
先にも書いたが、勝利数というのがいわば理不尽な数字であり、最近ではあまり重視されなくなったと言われている。その代わりに出てきたのがQS (Quality Start: 先発投手が6回以上投げて自責点を3点以内に抑える)だが、これもまた偶然に支配されることの多い数字でもある。守備力の影響や、そもそも6回以上投げて自責点3点以内という基準があいまいだ。また、先発投手ではない中継ぎや抑え投手は評価できない。そのためにより直接的に評価できる指標としてWHIP (Walks plus Hits per Innings)が考案された。「1回当たり被出塁数」というべき数字が少ないほどよい投手であるという指標で、出塁率を高く評価した指標になっている。
さらに出塁の内容まで考慮したものがDIPS (Defense Independent Pitching Statics)で、守備とは独立した投手の能力を評価する値として、奪三振、与四死球、被本塁打といった数字の他はインフィールドに飛んだ打球がヒットになったのかアウトになったのかを考慮しない評価になっている。具体的にはFIP (Field Independent Pitching)という指標が考案され、被本塁打、与四死球、奪三振の数を防御率の値に近似されるように係数を掛けたも��が使われることが多いという。
また、K/9やBB/9、K/BBなどもインフィールドに飛んだ打球を考慮せずに簡便に投手の価値を見るための指標としてよく使われる。K/BBはストライクで勝負して四球が非常に少なかった上原の値が非常によいことでも一部で有名だ。NPBでも歴代圧倒的一位であるし、MLBでも傑出した値をたたき出している。
さらに踏み込んで、インフィールドに飛んだ打球の種別によっても評価をすべく、ゴロ、内野フライ、外野フライ、ライナーの得点価値やアウト確率を割り出して、そこから失点率を示すように計算したtRA (true Runs Allowed)と値が、より正確に守備から独立した投手価値を算定するものとして試みられている。
これらのFIPやtRAの値のリーグ平均との差をRSAA (Runs Saved Above Averaged)として割り出し、リーグの平均的な投手と比べてどれだけ優秀なのかを評価するようになっている。さらに球場ごとの差分をなくすための補正なども行われる場合もある。勝利数と防御率で評価をしていた時代と比べると隔絶の感がある。
■ 打者編
打者の評価においては、三冠王のタイトル部門である打率、本塁打、打点から出塁率、長打率重視に移っている。『マネーボール』でも選球眼がよく四球が多く出塁率の高いが打率はそこそこだったためそれほど評価が高くなかったユーキリスをアスレチックスが格安で獲得できた話が印象的だが、現代のMLBではもはやそういう価値と評価のギャップはうまれづらくなっているだろう。また、打率よりも出塁率や長打率を重視することからイチローのような単打を積み重ねるタイプの打者の評価が高くなりづらく、同様のタイプの打者がイチロー以降あまり見られないこともその影響だろう。
具体的なデータとして、出塁率や長打率の方が打率よりも得点との相関性が高いことが示されている。そして、その出塁率と長打率それぞれよりもさらに得点との相関が高いものとしてそれらを合算したもOPS (On-base PlusSlugging)が近年では最もよく打者の能力を測る指標として使われている。MLBの試合放送やニュースでは普通にOPSが使われているのがわかる。出塁率と長打率をそのまま足さずに重みづけを付ける試みがされたが、それほど得点との相関は大きく変わらないため単純合算であるOPSが使われている。
もう少し四死球、単打、二塁打、三塁打、本塁打、アウトの得点価値を算定して率を取ったものがwOBA (weighted On-base Average)である。ここから投手におけるRSAAのようにリーグの平均からどれだけ優れているのかを示すことを目的としてwRAA (weighted Runs Above Average)やwRC (weighted Runs Created)という指標が考案されている。
■ 守備編
これまで守備に関しては数値化が難しい部分であり失策率などが指標となっていたが、それでは難しいボールに追いつく能力、いわゆる守備範囲の広さ、などが測れないことが課題であった。これをフィールドをゾーンに分解して飛んだ打球の位置や強さなどを映像から解析して評価することができるようになった。これを守備範囲+失策をしない能力+併殺奪取能力+肩の力に分解して得点期待値ベースに数値化したものをUZR (Ultimate Zone Rating)という指標として各守備位置ごとにデータ解析会社が独自に出していて、日本ではデータスタジアム社とDELTA社がそれぞれ値を��している。本書ではこの二社の結果を比較していて、例としてセリーグ・パリーグの遊撃手の値が出ている。上位三名の顔ぶれが同じで、パリーグは順位まで同じ。西武ライオンズの源田が飛びぬけた数字を両社でもたたき出していて、ある程度信頼できる指標だとも言えるのではないだろうか。
また、MLBに目を向けるとStatcastを用いてCatch Probabilityが算定されるようになっていて、いかにそのファインプレーが素晴らしかったのかが直感的にわかるようになり、楽しい。失策という失敗した数だけでなく、チャレンジをして他の野手ならヒットになっていた打球をアウトにする能力を評価できるようになったのは、データ分析の正当な進化だと思う。
■ 走塁編
走塁の評価は難しいが、盗塁については試行数と成功数からきちんと数値評価できる。盗塁は失敗によるマイナスが大きく、盗塁数だけを見ていては評価することができない。これを得点価値ベースに換算したものがwSB (weighted Stolen Base Runs)になる。ここから盗塁成功率が70%を超えないと盗塁の試行自体が悪い戦法だとされる。ちなみに2021年の大谷翔平の成功率は26回成功/36回試行=72.7%でぎりぎりプラスかもといったところ。失敗数はリーグワーストでこの辺りは改善の必要があるだろうと言われるところ。なお、イチローはNPB時代の成功率85.78%、MLBでも81.3%と高い水準を保っている。
また、守備と同じく走力もタッチアップや二塁からヒットでの本塁生還なども含めて総合的に評価できるようになっており、これもUBR (Ultimate Base Running)という指標でNPBでも前述の二社が算出を行っている。
■ 総合指標
それでは、投手や野手含めて選手の価値を総合的に評価する指標はないのだろうか。それが、WAR (Wins Above Replacement)である。野球の目的が試合に勝つことなのだから、それにどれだけ貢献したのかを示すのが最も妥当だろう。具体的な定義は「その選手と同じ出場機会を最小のコストで代替可能な控え選手が出場した場合に比べて、どれだけチームの勝利数を増やしたか」と言う基準で計算されたものだ。実際にどうやって計算するのかは各社のノウハウになるが、ベースはこれまで投手編、打者編、守備編、走塁編で出てきた指標をいかに組み合わせるのかということになる。
面白いのは、これまでの指標のベースが基本的には得点期待値によっていたが、これを勝利数に変換する必要があるのだが、この式が比較的シンプルな「ピタゴラス勝率」と呼ばれる式になっていることだ。具体的には、「得点^2/(得点^2+失点^2)」で、ピタゴラスの三平方の定理に形式が似ていることからこう呼ばれている。ここから1勝積み上げるために必要な得点数が導き出せる。
WARが有名になったのも、投手と野手の二刀流の大谷をMVPレースで評価するときに、野手としてのWARと投手としてのWARを足して二刀流選手と他の選手のWARとの比較を行ったことからだろう。本書では具体的な算出方法が記載されていて、打撃はwRAA、走塁はUBRやwSB、守備はUZR (指名打者は低い)、投手はFIPベースでこれらに色々な補正を掛けて算出される。この辺りかなり詳しく書かれているので興味があれば追いかけると楽しい。
ちなみにNPBの2021年のWARが最も高いのはセリーグは大リーグに移籍した鈴木誠也、パリ���グは山本由伸だった。
■ ストライクゾーン
これまでは球審の専権事項だったストライク・ボールの判定が機械によっても判定できるようになった。試合中継でもストライクゾーンが四角枠で表示されて、そのゾーンを通ったかどうかがすぐにわかるようになった。このデータを取ることで面白いことがわかるようになった。
打者に関しては、ストライク・ボールそれぞれ振る確率やストライク・ボールを振ったときのコンタクト確率までデータを取得することができる。スイング率やコンタクト率を見ることで、積極的な打者や選球眼のよい打者といったこれまでイメージで語られていた打者像がしっかりと数値で示すことができるようになった。例えばイチローはボールのスイング率も高かったが、同時にコンタクト率も高く、打率も高かった。
投手でも同じく、球種ごとのストライク率や空振り率をデータとして利用することができるようになり、解説者も大谷のスプリットの空振り率がいくらだといったようなデータを参照しながらしゃべることも普通になってきた。
また、捕手の捕球時のフレーミングに関しても本当はボールだったものをストライクに判定させることができる率が高いほど優れていると数字で示されるようになった。捕手のフレーミングはこのデータで評価可能かもしれないが、盗塁阻止能力(投手のモーションに依存)やリード(投手のコントロールにも依存)をどのように評価するのはセイバーメトリクスの今後の課題でもある。
当然、球審の判定にも適用されるが、面白いのは、実際の判定のストライクゾーンが長方形ではなくて角が丸まったどちらかというと丸にも近い形をしていることや、カウントが2ストライク時や3ボール時などで有意にストライクゾーンが変わることが示されていることだ。球審にとっては多難の時代になったということだが、もはやアウト・セーフも機械判定ができる時代なのだから、ストライク・ボールの判定は機械にやらせるようにした方がよいのではないかと思う。
■ NPB分析
著者は、セイバーメトリクスを駆使して、2020年と2021年のNPB各チームの各ポジションのwRAAと投手のRSAAを比較して分析している。この辺りはファンの方なら大変興味深いはずだ。また、2021年の得失点の移動平均のグラフが付いているので、浮き沈みの激しいチームやシーズンを通しての調子の上下などがわかって面白い。
また、MLBのセイバーメトリクスの数字にはパークファクターと呼ばれる球場ごとの有利不利を補正したものが用いられることが多い。例えばボストン・レッドソックスの本拠地フェンウェイパークやサンフランシスコ・ジャイアンツの本拠地AT&Tパークなど左右が非対称な球場も存在するし、大きさも比較的バリエーションがある。また、空気の薄い高地コロラドにあるロッキーズの本拠地クアーズ・フィールドはボールがよく飛び本塁打が多く出る球場として知られている。
このボールパークファクターについて日本の球場についても測定を行った結果も掲載されていて、東京ドームや神宮球場、千葉マリンZOZOマリンスタジアムは本塁打が出やすい球場で一方でナゴヤドームが本塁打が出にくい球場でその差が優に倍以上あるのは驚きである。
【所��】
セイバーメトリクスはMLBから発祥して、徐々にNPBにも輸入されてきた。それにしてもアメリカ人はデータ好きである。NFLでもたらふくとデータが出てくるが、野球は本当にデータ向きのスポーツだと改めて思った。欧州で人気のサッカーではこういう風にはいかないんだろうと思う。一球投げるたびに球種と速度と回転数が出てきたり、打球についても同じく射出速度と角度が出てくるのは、新しい楽しみ方だ。
また、計測できるデータは計測し、そのデータによって構成に評価をして効果を最大化しようという流れは野球に限らず世界全体の趨勢だろう。客観的な数字で評価されるという観点では、WARなんていうのは、今流行りのジョブ型の働き方において、その職種での平均的な人材に比べて自分がどれだけ追加の価値を提供できるのかというような考え方にもつながりそうで、それはそれでよいのか悪いのかわからない。
そして、改めてブルーバックスらしい本。素晴らしい、大好き。
投稿元:
レビューを見る
最近データサイエンスの動向が気になっており、タイトルに惹かれて購入。アメリカでは野球についてもデータ重視の傾向が野球を変えてきていることが感じられた。私は野球にどのような統計学的手法が用いられているかに興味があって読みだしたのだが、そういったものについて説明した本ではなく、打撃、投球、守備、走塁、といったものをどういう指標でとらえることで最もそれぞれの貢献度をうまく説明できるかについて書かれたものだった。それぞれに基本的に得られる、基本データ(打者で言えば、ヒット数、四死球数、エラーによる出塁数、総打席数等)を用いていかに貢献度を正確に見積もる定義を作成してくことができるか、そういう基準値作りが重要だと書かれていると感じた。私が期待した内容とは違うものではあったが、統計処理をする前に統計対象の量をどう扱うかについては工夫が必要なのだな。と知ることができたので、その点はよかった。
投稿元:
レビューを見る
最近のスポーツ競技は詳細なデータ収集・解析が行われており、競技者の技術力向上や能力評価に使われている。
野球では、打者なら打率・打点・本塁打、投手なら防御率・勝利数・奪三振数が重要視されている。
野球は昔も今も個人の記録を比べて楽しむスポーツでもあるので、今後も変わらないでしょう。
スポーツは相手に勝つことを目的としているので、勝つために有意義なプレーを正当に評価しなくてはなりません。
そこで新しく重要視されてきたのが、セイバーメトリクスが編み出した指標だ。
さまざまなプレーを得点化し、勝利への貢献度が示されるように工夫・改善されている。
過去のデータを調べて、打率よりも出塁率や長打率が得点との相関関係が強いことが分かった。
そこで、出塁率と長打率を足した指標"OPS"がMLBでは公式記録となり重要視されている。
打撃、走塁、守備、投球を総合的に評価して選手の勝利への貢献度を表す指標が"WAR"である。
昨年度の大谷翔平のOPSは、.965で2位の成績。
大谷の場合、走力も高いので走塁での加点はあるが、DHなので守備では大きな減点がある。
その結果、野手としてのWARは10位になる。
だが、投手としての成績を加えるとメジャーでトップのWAR値になる。
単に二刀流の話題性だけでなく、こうした裏付けのデータがあるので、「満票」でMVPに選ばれたのだと説明されている。
日本では、原則優勝チームからMVPが選ばれるので昨年はヤクルトの村上だったが、WARで断トツのトップは広島の鈴木誠也だった。
パリーグのMVPは、優勝チームのオリックスの山本由伸がWARも断トツで順当な評価だった。
東京ドームは"ホームランが出やすい球場"だということは、野球解説などでよく耳にする。
2021年の本塁打パークファクターのデータも示されていて、出やすい順に示すと
1.44 神宮、1.40 東京ドーム、1.02 甲子園、1.02 横浜、0.70 マツダ、0.57 ナゴヤ
1.49 マリン、1.40 福岡、1.07 西武、0.82 京セラ、0.77 札幌、0.66 宮城
となり、球場の違いを加味した戦略を立てる面白さもあるが、球場によって差がありすぎるように感じる。
守備の指標は点数化するのが難しい。
昔はエラー数が少ないと守備がうまいとされたが、今はアウトを稼げる選手、さらにはアウト数よりも、どれだけ失点を減らしたかが評価される。
例えば1アウト、ランナー3塁で外野フライ。
並の選手が守っているならタッチアップだが、新庄やイチロークラスの選手が守っているなら本塁は狙わない。
3塁ランナーが足の速い選手なら、本塁突入で1点入ったかもしれない。
結果的に3塁ランナーはそのままで、アウトカウントが1つ増えただけになった時、外野の守備はどう評価すべきか?
守備の指標はいろんな条件を加味する必要があるので万人が納得する形での点数化が難しい。
盗塁は相手のバッテリーにもよるが比較的数値化しやすい。
成功すれば得点の確率が上がるし、失敗すれば下がる。
1アウト1塁で盗塁成功なら��1アウト2塁だが、失敗すると2アウトランナーなし。
成功は0.173の得点価値、失敗は-0.407というデータもあるので、70%以上の成功率でないと価値はない。
イチローの盗塁成功率は山田哲人と同じくらいで85%を超えており日本プロ野球でトップである。
盗塁と比べると走塁の点数化は難しい。3塁の走塁コーチが無謀に本塁突入を指示することもあるし、、、
最近では選球眼を正確に測ることにも取り組んでいるようだ。従来は四球の多さを判断基準にしていた。
今はボール球をスイングする割合を計っていたりする。この数値が小さい程良いとして検討してみる。
だが、イチローのようにこの数値が比較的高いのだが、ヒットにする率も高い選手もいる。
ルールで決めたストライクゾーンでなく、独自のヒッティングゾーンを持つ選手の指標にはならないのだ。
面白いと思ったのが実際のストライクゾーン。
これは、球審がストライクとコールしたゾーンのデータを見ると分かる。
ストライクゾーンは丸い。四隅はボールと判定されている。
3ボール後のストライクゾーンは広くなり、2ストライク後は狭くなる傾向も見て取れる。
先日、大谷翔平がインコース低めをストライク判定され見逃し三振となり、"No"と言って首を横に振っていたが、リプレイ映像を見るとストライクだ。
きっと、ボール判定されることが多い(ストライク)コースなのだろう。
随分前から、打者なら、打球の速さ・方向・角度、投手なら、投球の速さ・回転軸・回転方向・回転数・軌道の変化などが見れるようになった。
投手なら、直球と変化球を投げる時のフォームの違いも分かるようになった。
昨年度はヤクルトだけがホークアイというシステムを取り入れ、リーグ最弱だった投手陣の立て直しに成功したことが優勝に繋がった(らしい)。
捕手の守備力の評価も数値化するのは難しい。
盗塁阻止、捕逸、フレーミング、配球など要素はいろいろあるが、投手との兼ね合いが大きく純粋に捕手としての個の能力は算出しにくいだろう。
その他、勝負強さを評価する指標も考えられているようだ。
野球は、個々の選手が行うさまざまなプレーが数値化しやすいスポーツだと思う。
サッカーもプレーのデータをうまく数値化できれば観る目も変わるかと思うが、選手個人の記録について楽しむ余地が非常に少ないですね。
投稿元:
レビューを見る
統計学については全然わからないからどうしてそういう計算式になるかということについてはチンプンカンプンだったけど、無死一塁でいきなり送りバントをしても、たとえ成功したとしても得点に繋がる率は高くないんだというのは知らなかったな。だからそう考えると色々セオリーと言われているものは、根拠を示されると弱いものが多いんだな。
原が坂本を2番に置いた時は何考えてるんだろうと思ったけど、丸と岡本と繋げて行く打線は得点効率という意味では理に適っていたんだな。
でも、1964年の王貞治だけで1番から9番まで並べたら1試合で15点取るというのは笑ってしまった。
投稿元:
レビューを見る
今までOPSやwarなどの単語は知っていたが、ここまで複雑な計算をしているとは知らず、勉強になった。
統計学の考え方についても勉強になった。
データから、何かしら定義付けして指数を出してズレがないか確認し、より正確に評価しやすいよ数値化していく。
今の野球はいろいろな数値化して、よりクオリティの高いスポーツになっていくのだと感じる。
ただし、やっているのは人間なので、心理が働くことも忘れてはならない。
投稿元:
レビューを見る
やっとオーピーエスがわかった
長打率はたんだも加えた町田の歩行に比重をかけた値
プロ野球はシフトの問題が大きいと思う
Dh星も取り入れるべきだ
一対1の勝負を強調すべき
投稿元:
レビューを見る
OPSなど認知度が高まっているものから、全く知らなかった指標まで。計算方法や、その指標が考案された背景など興味深く一気読みしました。
本文中にもあったように、一長一短ある指標も多いわけですが、選手の年俸を決めたり、どのような補強を行うべきかなど幅広く利用されているのでしょう。
終盤の球審のストライク判定ゾーンは円形、とかカウントによって変わるとか、妙に納得。分析手法も、競技ルールも、形は変わっていくのでしょうが、王、長嶋、イチロー、大谷、村神、輝く選手の活躍をこれからも楽しみたい。
投稿元:
レビューを見る
ここまでくるとイヤになるな。
楽しくない、野球が笑
でも、それは私の能力の問題。
でも、好きな人にはタマらんやろな。
こんな風に選手を評価することについては、
圧倒的に賛成します!
投稿元:
レビューを見る
OPSなど、最近よくみる野球選手を評価する新しい指標について、しっかりと定義を書いてくれている。手元に置いておきたい本、となりました。
投稿元:
レビューを見る
もはや耳新しい言葉ではなくなった野球に関する分析法─セイバーメトリクスにおいて、どのように数値を集め処理をするかということを紹介する本。あまたある数値のどこに注目するかという視点は興味深かったのだが、この分析法を使うことによって実際どのように野球に変化が起きたか、具体的な理論の先の実践を知りたかったので、物足りない印象が残った。しかしそれにしても王貞治の成績がやはりすごいことには目を見張る思いだったな。
投稿元:
レビューを見る
Money Ballの映画みたいけど、AmazonPrimeにならない。
ちと興味あったセイバーメトリクス、少し理解しようと、2冊関連する本を購入。その1冊目。
タイトルはやや大仰かもだけど、広く理解深めることができた。
最近は、打球の角度やら飛距離やら軌道、こういうのがテレビでも表示されるようになってきてるけど、その裏には、映像・デジタル技術をスタジアムに展開する活動あり。
野球好きな人のアイデアで新たな視点のセイバーメトリクスが生まれるかも?
サッカーのほうは野球よりも先にデジタルデータ収集が進んでたイメージだけど、常に動き続けるスポーツで、こういう統計的な見方による知見ってあるのだろうか。