投稿元:
レビューを見る
3章くらいまで読んだ.
面白いのだけれど,まだ一つも数式が出てこないのが物足りない.
フィッシャー好きやら頻度論派と比べて批判されてきたのに
機械計算とともに本来の価値が見出されるようになったぶん,
多少持ち上げ過ぎじゃないだろか?と思う内容や,
さっき読んだよな?という重複も含まれる.
読み物としては大変面白いけど,ベイズ統計学やベイズ推定は学べません.
投稿元:
レビューを見る
すごく歴史とかをきちんと押さえてるんだけど、あんまりベイズそのものが理解できる本ではないです。エニグマのあたりも面白いけど、他の本にも出てくるしなあ。
投稿元:
レビューを見る
1700年代にトーマス・ベイズが「ベイズの法則」を作った。それ以降、何度の致命的な打撃を受けながらも、かろうじて生き延びてきた。ベイズは棚上げし、プライスは無視され、ラプラスは再発見したが、頻度主義を好み、頻度主義者は封殺し、軍は隠し続けた。1967年にモステラーとテューキーが次のように振り返っている。「トーマス・ベイズは、自分が作った法則に背を向けた。その四半世紀後、ラプラスはこの法則を称揚した。そして1800年代には利用され、同時に土台を崩された。1900年代初期には嘲笑され、第二次対戦中はひた隠しにされながらもうまく使われ、戦争が終わると思いがけず精力的に、そのくせい妙に見下した態度で利用された。ところが1970年代の初頭になって、ベイズの法則は停滞機に入った。」(321頁) コンピュータ発達後も足踏みが続いたが、徐々に成果が出始める。画像解析法、数値積分法、マルコフ連鎖モンテカルロ法、ソフトウェア化、など、ベイズの手法は進化し、環境が整い、様々な分野で活用され、成果を出してきた。「ベイズの法則」に関わった学者の素性・経歴、ベイズ派と頻度主義者による主観性と客観性に関する諍い、18世紀から21世紀のベイズ統計学とその周辺の歴史について、大勢の登場人物を通して、多くの出来事とともに、性格・人間性までも、仔細に描き出され、臨場感あふれる展開を楽しめた。原書を読んではいないが、富永星氏による翻訳は念入りによく練られていて、巧みであると思われる。
投稿元:
レビューを見る
歴史とかの冗長な話が多く、読み進めるのが辛い。
ベイズの法則だけなら、巻末のappendexだけ読めば
済む感じ
投稿元:
レビューを見る
ベイズの定理は大学では当然の定理として習ったのだが,21世紀まで論争が続いていた?
歴史がよく分かる。
この本でベイズの定理を勉強しようと思ってはいけない。定理は事前知識となっていることが前提だ。
あれもこれもベイズに関連していたとは。
和訳のタイトルは原題をちゃんと伝えていない気がする。特に副題を略してしまっては興ざめである。
2014/02に図書館に予約して,3月23日に入手;早速読み始め;厚かったので4/5までかかって読了
投稿元:
レビューを見る
ベイズ統計学の歴史。もともとはベイズ神父が事前確率をベースに事後確率を計算するアイディアを考えたが、実際に数学的に確立したのはフランスのラプラス。統計学の主流はデータを基にした頻度主義となり、主観的な事前確率の設定を科学的ではないと批判されたベイズは陰に回ることになる。しかし、頻度主義に基づく検定は大量のデータが必要である一方実際の意思決定は一度きりしかない事象をも扱う。よって戦争での暗号解読や不発弾の探索などにベイズ統計学が応用された(そのことによる秘密主義がベイズの一般化を妨げた可能性もある)。近年ではより数学的な洗練化が進み、事前確率をより客観的に置く手法やコンピュータによる計算速度のアップによりよりベイズが使われるようになった。ベイジアンフィルタや選挙予報など。ルネサンステクノロジーズなどのヘッジファンドでもIBMのベイジアン統計学者を雇い分析を行っているらしい。
投稿元:
レビューを見る
ベイズ統計学の歴史について。
ベイズ統計学がどういうものか、具体的な数式は全く出てこない。
事前確率は主観によるものでありしかも事前確率の見込みによって結果が左右されるということに対してごく最近までフィッシャーに始まる頻度主義の立場からの強い反対が続いていた。
実際問題としてもコンピューターによる計算能力が一般的に使われるようになるまでは積分(ここでいう統計というのは確率分布の計算なんだという)の計算が大変で、なかなか実用には至らなかった。確実なデータが入手できるのであれば頻度主義でもベイズでも同じような結論に達するが、計算などは頻度主義の方が楽だ。
カルマンフィルタなどの発明により、新しい情報が加わった場合、確率の計算を一から始めなくてもできるようになった。
コンピュータが発達し、マルコフ連鎖モンテカルロ法(MCMC)が使われるようになってからは現実的な問題、特に地震や航空機事故などのようにあまり起こらないような出来事ではベイズが必須になっている。
投稿元:
レビューを見る
ベイズ統計の手法については概念的にはわかりやすい。事前の予想に対して新たに得られたデーターを反映させ予想を修正する。実験であるパラメーターを変化させて得られた結果からパラメーターの最適値を推測するというのは自然科学でも社会科学でも違和感はないだろう。しかしこれを確率としてとらえ、式にあてはめると少し分かりにくい。18世紀の聖職者トーマス・ベイズが発見した後打ち捨てられ、数十年後に偉大な数学者ラプラスが独自に再発見し完成させたベイズ統計の式は次のように表される。
まずべイズ統計の原理だがこれだ。
P(C/E)=P(E/C)/ΣP(E/C’) Pは確率、Cは原因、Eは結果として
P(C/E):Eという得られて結果に対して原因がCである確率
P(E/C):原因がCの場合に結果がEとなる確率
ΣP(E/C’):原因C1、C2・・・に対しそれぞれ結果がEとなる確率の合計
例えばサイコロを何回か振って合計が5の場合に2回ふった確率は?
P(E/C)は4/36
ΣP(E/C’)は1/6+4/36+6/216+4/1296+1/7776
P(C/E)=36% 手計算だが合ってるのか?(笑)
ラプラスが完成させた一般式はこうなる。
P(C/E)=P(E/C)xP”(C)/ΣP(E/C’)xP”(C’)
このときに P”(C)は事前に見積もった原因Cが正しい確率(事前確率)としている。
これだけ見ても何のことやらなのだが実際の使用例を挙げると少し雰囲気が分かる。
マンモグラフの乳がん検査の確率が補遺にある。
P(C/E):マンモグラフ検査が陽性の際の乳がんの確率
P(E/C):がん患者のマンモグラフが陽性になる確率=80%
P”(C):乳がんの確率=約0.4%
ΣP(E/C’)xP”(C’):(理由はどうあれ)マンモグラフが陽性の確率
偽陽性の確率が10%あるため 99.6%x10%+0.4%x80%=10.28%
P(C/E)=80%x0.4%/10.28%=3.1%
マンモグラフは80%と比較的信頼性の高い検査なのだが、偽陽性も10%と高く出てしまうことと、元々乳がんの確率が0.4%と低いこともありマンモグラフを受けて陽性の場合に実際に乳がんである確率はわずか3%でしかなく、アメリカ政府の「乳がんスクリーニングに関する特別チーム」は2009年に40代の女性の大部分は1年に1回のマンモグラフは受けない方が良いと助言した。
ベイズの手法は実際には事前確率がはっきりしない場合にも適用されている。乳がんとは違い事前確率として有用なデーターがない場合には主観的な数字を入れて後から観測結果を元にデーターを更新するのがベイズ派のやり方だ。伝統的な頻度主義者(観測数/母数)の場合これまでに起こったことのない事故の確率を計算しろといわれてもお手上げだがベイズ派は例えばチャレンジャー号の事故について1/35という非常に高い事故確立を見積もっていた。エニグマの暗号解読にはじまり、保険業界が料率の決定にこの手法を取り入れ、資源保護、グーグルの機械翻訳などΣP(E/C’)のところの計算が非常に煩雑なため昔は役に立たなかった領域でもコンピューターの能力が上がりベイズ推定の使われる範囲はどんどん拡がっていった。
頻度主義であれば一定量のデーターがなければ統計的には信頼性が低いとするところをベイズの手法は漸近的な解を出すので意思決定をする際に少ない��ーターで決断しなければならない場合に適用しやすい。例えばうなぎが減った原因は色々考えられるが稚魚の乱獲の確率をだし、漁獲量を制限した場合にどれだけ資源量が回復するかとか、原発の下の断層でこの先30年以内に大地震が起こる確率だとか。難しいのはその場合に事前確率をどう置くかで計算結果が変わってしまうところだ。反対派からはデーターを恣意的に選んでいるとの批判が出ることは簡単に予想できる。
1968年にアメリカの攻撃型原潜スコーピオン号が姿を消した際にはベイズの手法が力を発揮した。スコーピオン失踪の直前にある聴音装置が極めて深い海中でピンという不思議な音を観測していた。そこで海底の地形図、海流なども組み合わせ音の発生源をスタートにスコーピオン号がランダムに航行したというシミュレーションを繰り返して1万個の予想地点をプロットすると地図上の方眼に明らかに有望な場所とそうではない場所があらわれたのだ。当初探索が行われた場所からはなれた場所に不思議な金属片が見つかっており、このシミュレーションを元に探索結果を更新していくと発見予想地点はだんだんとこの金属片の場所に近づいていった。最終的にはシミュレーションの高確率セルと発見点は260ヤード離れていたが160平方マイルの探索域の中での260ヤードは上出来だ。このときに使われたランダム化手法のモンテカルロ法はコンピューター将棋などにも使われている。
人間は無意識にベイズのアプローチを使っているようだ。例えばパットの練習で全く同じ打ち方(といっても誤差がある)をしてホールからどれだけ離れているかを計算し方向と強さを合わせるという様なことは普通はしない。得られた結果を元に少しずつ方向と強さを調整し修正していっているはずでこれはベイズのアプローチと言える。方程式は理解していなくてもこのやり方が役に立つのはわかる。この本では正統的な統計学からは相手にされなかったベイズ統計が色々な現場で採用されていき、今では主流と言えるまでに拡がった様子が描かれている。
投稿元:
レビューを見る
創始者たちの思考プロセスが辿れるので理解が深まる部分はあるが、中盤以降の「ベイズ手法でこんな凄い事が出来ました」の羅列は、数式が無さ過ぎてフラストレーションが溜まる。
事例は非常に興味深いので、ケーススタディの解説書が無いものだろうか。
投稿元:
レビューを見る
今更ながら機械学習に興味持ってチョコチョコ調べてたら、やたらと出てくるベイズベイズ。いったいベイズってなんすか?いうことで読んでみました。
無限回サイコロ振ったら出る目の確率は1/6に近づくという、一般的に良く知られている確率との対比で捉えられることの多いベイズ。わたくしフィルタの解釈やと、
・まず、発生すると考えられる各事象に対して、確率(初期値)をそれっぽく割り振る
・得られた情報を元に、発生確率を更新していく
・フィードバックを繰り返して、どの事象が一番確からしいかを検証する
初期値の決定方法が独特なので「主観が入るなんてケシカラン(#゚Д゚)」とほんの50年ほど前まで、アカデミーの世界では異端視する学者さんが多かったらしい。ただ、実際発生していない事象に関しても考察できるので、暗号解析、Uボートの探索、リスク分析等、実務では第二次大戦時代から使われてたとのこと。
そして、多くの仮説を立てるぶん、計算が複雑になる弱点があったんやけど、コンピューターの発展とともにベイズも花盛り。経営の意思決定、画像解析、スパムフィルタ、人工知能、Googleの中の人、などなど実はそこらじゅうベイズであふれてますよ、というお話。
いや~、不勉強ながらベイズ舐めてた。。。ぜひもうちょっと深堀りしたい、と思わせてくれる一冊(-_-)
投稿元:
レビューを見る
統計の勉強の傍ら、そもそも統計学のイメージが自分にはないことに気づき読んでみました。
題名からベイズの歴史に焦点は当てているものの、それに対する頻度統計の反対となる論理も詳しく書かれています。
物事を学ぶには歴史を知るのも大まかなイメージを掴む上で、重要なことなのを再認識しました。
ストーリーとしても非常に面白かったです。
特にドイツの暗号エニグマに関しては、「暗号解読」も前に読んだことがあったので、違った視点で同じことを見ると全然違うように見えました。
投稿元:
レビューを見る
ベイズ統計の歩みが頻度主義統計との論争を軸に語られる。数式はほとんど出てこず、その歴史をテンポよく知ることができる。これを読めばベイズ統計に興味が深まることは確実だ。(この本を手に取っている時点で興味は持っているのだろうが)
ベイズ統計とは何かを知らなくても読み進むことは可能。
ただ頻度主義をけなす傾向があり、必要以上にその価値を小さく描いているのはフェアではない。現在のベイズ的手法もその知見を利用していることを頭の隅に置いておくべきだ。
投稿元:
レビューを見る
科学であっても、その時代背景によっては受け入れられないことがある。ガリレオだけではない。そして技術の進歩により、その有用性が初めて理解される場合もある。そんな流れが詳細に記述される好著。
投稿元:
レビューを見る
ベイズ(確率)に関係する歴史についてがメインの書籍でした。
これから起きる可能性が過去の経験値からわからなくても、とりあえず、適当な値を設定して、事が起きた事実を使って、計算を繰り返すことで、答えに近づく手法。例としては、正方形のテーブルとボールの例が書かれており、その一投目がどこに落ちたか皆目見当がつかないけど、あるところだと仮定して、二投目からは一投目より右なのか左なのかを確認しながら繰り返すことで、だんだん一投目が落ちたところを狭めていくと。
「このような考え方では、決して正解にはたどり着かない。ただ、ある具体的な領域に落ちた可能性が最も高いといえるようになる。」
一投目の適当なことを言っちゃうところが科学的ではないということで、理論派(?頻度確率派)からいろいろ言われるも、最初から起きる可能性がわかっていない事象に対しては、ベイズの手法の方が実際効果が出てるという事例が多数紹介。
暗号解読、保険数理、たばこと肺がんの関係、核兵器事故、著者判別、大統領選、原発事故、潜水艦探索、金融市場予測、スパムメール除去等。
計算量が多くなることと、実際のデータを集めて何度も繰り返す処理がコンピューター向きで、かつ、新しいことを始めるにあたって、最初に主観データを設定して実データで確からしさを上げていくのは、走りながら考える必要があるビジネスの現場では、マッチするのだなと。
凄いアルゴリズムの発見からのブレークスルーではなく、ちょっとした計算を繰り返すことで、結果として意外なことをしちゃっているところが、凄い。
ただ、事例にあるようなことを具体的にどうやってやっているのか?他にももっといい手法などがあるのではないか?等々、本の文章量が多かっただけにもう少し深く書かれていて欲しかった。
ちなみに、Wikiでベイズ確率を探すと、この本で用語名は出てくるものの詳細が書かれていない物については、確認できる。
この領域は、もっと勉強が必要。。。
投稿元:
レビューを見る
病気の治療法を計れることが、個人的に好きな部分。日本がこれを扱えないのが残念。がん検診やワクチン禍についてまともな評価が出せるはずなのに…