紙の本
世の中の事象から統計学がどのように使われているかを知る一冊
2021/01/24 15:00
0人中、0人の方がこのレビューが役に立ったと投票しています。
投稿者:もちお - この投稿者のレビュー一覧を見る
統計学の入門書は世にたくさん出回っているが、本書は一見全く違う事象を並べたうえで共通する統計学の考え方を解説してくれるが、それぞれの事象を描写する表現がとにかく読ませてくれるのと、意図的に数式を一切見せずに言葉だけで説明できる力量がすごい。
紙の本
邦訳タイトルがダメだが内容は良かった
2019/07/18 10:51
0人中、0人の方がこのレビューが役に立ったと投票しています。
投稿者:ルイージ - この投稿者のレビュー一覧を見る
「ヤバい」シリーズのタイトル付けたが、内容は真っ当な統計学の読み物。こんなタイトルをつけることがやばい。
統計学を無批判に絶賛する本や逆に統計っぽい誤魔化しを批判する本が多い中、本書はしっかりした内容なので良かっただけに、とにかくタイトルが残念。売らんかなの日本の出版社がダサい。
投稿元:
レビューを見る
ディズニーランド、交通渋滞、クレジットカード、感染症、大学入試、災害保険、ドーピング検査、テロ対策、飛行機事故、宝くじ―10のエピソードで探求する「統計的思考」の世界。そのウラ側にある数字を知れば、統計学者のように思考し、自分の世界を自分で支配できるようになる。]
第1章 ファストパスと交通渋滞 ――平均化を嫌う不満分子
第2章 ホウレン草とクレジットカード ――間違っているからこそわかること
第3章 大学入試とハリケーン保険 ――グループ分けのジレンマ
第4章 ドーピング検査とテロ対策 ――非対称がもたらす動揺
第5章 飛行機事故と宝くじ ――「不可能」が起きるとき
おわりに
待ち時間の意味を変えて来園者を満足させたディズニーランドのファストパス
もちろん、ファストパスの利用者はこのシステムをとても喜んでいる。では、待ち時間は実際にどのくらい短くなるのだろうか。驚くことに答えは――「まったく短くならない」。ファストパスがあってもなくても、人気アトラクションの待ち時間は同じなのだ。先に紹介したディズニーファンの分析のように、ファストパスが待ち時間を「なくす」と誤解されている。しかし実際は、列に並んで待つ代わりに、その場所からは解放されるというだけで、それほど混んでいないアトラクションに乗ったり、食事をしたり、トイレに行ったり、ホテルの部屋やスパで休憩したり、買い物したりしながら「待っている」のだ。
「O157の感染源」をどうやって見つけたか
興味深いことに、ホウレン草の調査官は近道をした。「コントロール(対照)」に聞き取り調査をする代わりに、オレゴン州の全住民のデータを使ったのだ(比較する基準をつくるためなので、手法として問題はない)。近道ができたのはCDCのフードネット(州の公衆衛生部門のネットワーク)の先見性のおかげだ。フードネットは、さまざまな食品を食べる人の割合を調べる大規模な調査を定期的に行っていた。そのデータによると、1週間に1回はホウレン草を食べるオレゴン州の住民は5人に1人。これと比較して、感染者の80%がホウレン草を食べていたという数字は突出していた。
■3.米消費者金融の発展に貢献したクレジットスコア
クレジットスコアのシステムを導入した当初は、すぐに劇的な効果が表れた。小規模な企業への融資では、熟練の貸し付け担当者が1つの案件を処理するのに約12時間半かかっていた。同じ時間でコンピュータは50の案件のスコアをはじき出したのだ。こんにちでは、パーパラ・リッチーの自動車ローンがほとんど手間をかけずに承認されたのも不思議ではない――自動車ローンの80%以上は申請から1時間以内に承認され、25%近くが10分以内に承認される。コストコですぐに会員クレジットカードを手渡されたのも不思議ではない――店員は2分足らずで新規の口座を開設できる。クレジットスコアのおかげでクレジットカードの申し込み手続きのコストは90%削減され、自動車ローンの初期コストは半分になった。
■4.災害保険契約に関する不都合な真実
1970年~2005年に保険金の支払い額が最も多かった10件の災害��うち、上位8件はアメリカで起きて、支払い総額1億7600万ドルの90%以上を占めた。残りは日本の台風とヨーロッパの暴風が1件ずつだった。アメリカで起きた8件のうち6件は大西洋のハリケーンで、すぺてフロリダを通過した。グローバル経営とアクチュアリーのコンサルタント、タワーズ・ぺリンの計算によると、アメリカはロンドンの再保険市場で保険料の総額の半分を支払い、保険金の総額の4分の3を受け取ったことになる。このレべルの不均衡が続けば、ほかの加入者は不公平な契約だと気づくだろう。
■5.1人の陽性反応と引き換えに10人のドーピング違反者を見逃す
英デイリー・テレグラフ紙はジョーンズの派手な終焉を次のように評価している。「ドーピング検査の陰性反応には何の意味もないという不都合な真実こそ、マリオン・ジョーンズの一件における本当に重要な発見だ」。この素晴らしい洞察力が、どうしてほとんど注目されなかったのだろう。統計学的な分析からも、ドーピング検査では、陰性反応は陽性反応に比べてはるかに重要でないことがわかる。図4-1のとおり、実際にドーピングをしている1人を現行犯で捕まえる(正しい陽性反応)ごとに、約10人が処罰を免れる(間違った陰性反応)。ドーピング検査の本当の問題は、問違った陽性反応ではなく、間違った陰性反応なのだ。
■6.スクリーニングに嘘発見器を使うと多くの無実の人が犠牲になる
ケースA スクリーニング検査
●情報機関は職員1万人のなかに10人のスパイが潜んでいると考えている(1000人につき1人)。
●10人のスパイのうち、ポリグラフ検査は90%(9人)を正しく見抜き、1人を間違えてシロと判定する。
●残る9990人の潔白な職員のうち、ポリグラフ検査は10%にあたる999人を間違えてクロと判定する。
●スパイ1人特定するごとに、111人の潔白な職員を間違って告発することになる。
ケースB警察の容疑者リスト
●警察は100人の容疑者のなかから20人の殺人犯を捜している(5人につき1人)。(中略)
費用対効果の比率は、ケースBはケースAよりはるかに受け入れやすい。嘘発見器を、容疑者リストのように対象を絞った尋問に使う場合、犯罪者1人を捕まえる代償は1人未満の間違った告発だが、スクリーニング検査に使うと111人の無実の人が犠牲になる。
ケースAとケースBの判定の正確さが同じだとすると、費用対効果の違いが出る本当の理由は、検査を受けた人全体に対しクロの人とシロの人の比率が異なることだ。ケースAは無実の人の割合がかなり高い(1000人あたり999人)ため、間違える確率が小さくても「間違ったクロ判定」はかなりの数になり、それだけ多くの人が一生を棒に振りかねない。
■7.宝くじ販売店関係者が「大当たり」を獲得する「不正」
2006年10月25日に、公共放送局CBC(カナダ放送協会)のテレビ番組『フィフス・エステート』がこのスキヤンダルを報道。本当の当選者であるボブ・エドモンズの身に起こった事のいきさつを紹介した。(中略)
エドモンズが当たり券を盗まれたとOLGに訴えても取り合ってもらえなかったため、CBCはローゼンタールに鑑定を依頼したのだ。ローゼンタールは、販売店関係者が「幸運だというだけの理由で」5713本の大当たりのうち200本を当てる確率は、10の48乗(1の後に0が48個並ぶ)分の1だと指摘した。理性のある人はそのような幸運を信じるはずがない。この統計的分析に基づいて調査したところ、情けない話はラプランテ夫妻だけでは終わらなかった。販売店関係者の当選のうち最大140件が極めて怪しいと判明し、OLGには苦情が殺到した。
【感想】
◆米国での事例故、ピンとこなかったり、またその事例それぞれについて、説明が不足しているかもしれませんがお許しを。
本書は、冒頭のアマゾンの内容紹介にもあるように、10個の事例を用いて、「進取の気性に富んだ人々が情報を賢く活用して世の中を良くしている」ことを証明してくれています。
各章関連する2つの事例ごとで計10個。
プラス、おしまいの「おわりに」は、単なるあとがきではなく、各章の内容を整理するとともに議論をさらに広げている、という仕様です。
「最終章が終わったー」と思っても、その後に40ページもありますので、お忘れなくw
◆さて、ポイントでは7つしか挙げておらず、必然的に3つの事例はカットしておりますので、それらについて簡単に。
まずはファストパスとは対照的な、高速道路の渋滞を防ぐための「ランプメータリング」。
これは高速道路の進入車線(ランプ)に設置されている信号機で、基本的には「1回の青信号で車1台」入れるものです。
この信号機は、果たして渋滞解消に効果があるのか、また、それに従うドライバーはどう感じたのか。
◆また、全米の高校生を対象にしたSAT(大学進学適正試験)は、受験者をグループ別(人種、男女等)に比較して、難易度が同じかを毎回チェックしています。
その際、取り入れられているのが「似たような能力のグループを比較する」という方法。
たとえば、黒人の受験者全体を1つのグループ、白人の受験者全体を1つのグループと考えてはいけない、ということです。
そしてそれは、ハリケーン保険において、フロリダ州の平均的な住民が、災害に弱い沿岸地区に住む住民のために、結果的に「援助金」を負担していることにも関連するという(詳しくは本書を)。
◆第5章では、結果的に不正があった「宝くじが大当たりするグループ」と比較して、ナンタケット島に近い大西洋の海原にジェット機が立て続けに墜落している事実について言及。
墜落事故がランダムに起こるなら、同じ空域で4年間に4件の大事故が起きたことをどう説明するべきなのか……。
本書では、これら10個の事例において、統計学がいかに活躍しているかを分かりやすく説いています…って、内容説明だけで終わってしまった(スイマセン)。
投稿元:
レビューを見る
現実の事例をもとに、統計的思考で物事をみる力を養うことの重要性を述べた本。統計における基準として、間違ったシロ判定(悪い人)や間違ったクロ判定(良い人)を出さないよう常に研究がなされている。統計的思考を養うためには物事を局所的に見ない、ばらつきを見る、偶然の一致を疑うことが重要である。
投稿元:
レビューを見る
1章「ファストパスと交通渋滞」平均化を嫌う不満分子は自分の仕事にも関係する部分が多くて面白かった。
ピークの需要はいつくるかわかるけどどれぐらい来るかは読めないし難しいんだよね。
5章「飛行機事故と宝くじ」の冒頭にあるこの言葉が好きだ
「みなさまの旅の最も安全な部分は終わりました。ご自宅まで安全運転でお帰りください。」
どちらもものすごく確率が低いという点で同じ。
統計学の事例紹介の本はいろいろあるけれど良書の部類に入るのでは?
2つの事象を絡めて統計のウラオモテを解説しているのでわかりやすい。
投稿元:
レビューを見る
文系人間ながらタイトルに惹かれて購入。統計学の考え方を実例で紹介するので読みやすかった。ドーピング検査は違反者を見逃しているという事実に驚き、飛行機事故と宝くじの類似点に感心。今まで知らなかった統計学的考え方を身に付けられたら色々と役に立ちそう。翻訳書なので実例などは全てアメリカのものなのが少し抵抗にはなるか。
投稿元:
レビューを見る
世の中の様々な事象を統計的見方をすると面白いことが分かる。でも、結局は確率的な問題より心理的な観点で行動するのが人間。
投稿元:
レビューを見る
いつもながら、自分では手にとることがないような、幅広いジャンルの本に関する話が色々と聞けて楽しかったです。二時間があっと言う間に過ぎました。ありがとうございました。
投稿元:
レビューを見る
世界を成り立たせている数字についてその仕組みと付き合い方の指南書。
ハードカバーの分厚い本ですが、専門的な数式やグラフはほとんどなく、ある意味で「文系」的。
打率三割というのは「平均」して三割の確率でヒットを打つ。しかし打率が三割だから無条件に三打数一安打を期待するのは統計的思考ではない。果たして彼はどういう経緯で三割になったのか。例えば前半戦の好調が後半まで貯金になってまだ三割をキープしているのか、前半戦の不調を盛り返して三割まで打率が伸びてきたのか、そこに注目するのが統計的思考ってことかな。
よく考えてみれば当たり前のことかもしれない。でもちょっと世の中の数字の見方が変わるかも。
投稿元:
レビューを見る
統計学につきものの、取っ付きづらい数式とかは全くでてこない。
著者はアメリカ人なので、当然ほとんどアメリカの事例なので、背景がちょっと理解できない部分もあったりはする。ただそれを差し引いても身近な事例数例と統計学的思考方法を結びつけて、丁寧に説明してあり、非常にわかりやすい。
統計学をちゃんとやっている人にとっては基本的なことしか書かれていないかもしれないが、初心者(特に文系)が統計学を学ぶとっかかりとしてはいい本だと思う。
また、統計学という言葉にとらわれず、事実を論理的に分析するという思考は社会人としては必須。そういう観点でも有益な本。
投稿元:
レビューを見る
ふとヤバいシリーズが読みたくなったので買ってみた。
これだけは出版社も訳者も違うけど。
統計は世間に溢れているし、それが具体的にニュースなんかで引用されることもある。
しかし一体それは自分たちにとって何なんだろうと感じる時もある。
本書は幾つかの事例、場合によってはそれにまつわる統計を基に、それぞれの事例を統計学的に捉え、その思考法の意義、またそれが通念と多くの面で相違を見せていることを示す。
一口に数字と言っても、その見方次第でどう捉えるかが大きく変化することが理解できる。
身の回りに溢れる様々な情報が何を語っているかは重要だが、語られていない部分は何か、語られる情報の何に目を向けるべきか、考えさせられるし、心に留め置くべき教訓を得られたと感じる。
投稿元:
レビューを見る
統計学が実際に使われた例など。ファーストフードでカウンターをやってた身としては交通渋滞のエピソードが面白かった。車との距離を作るために高速に入る所で少し待たせることによって渋滞は解消され、実際には時間は短くなったのに、ユーザーとしては以前より時間が長くかかっていると感じてしまう。そして、以前のシステムに戻したという話だった。複雑な気持ちになった。
投稿元:
レビューを見る
二番煎じなタイトルと、妙な訳語を多用した翻訳で損をしているが、統計の重要な概念が分かりやすく書かれた良書。
第一章は分散について。渋滞やディズニーランドなどで待ち時間の長さを決めているのは分散の大きさで、これを小さくするための工夫がこらされている。しかし、現実世界では実際の待ち時間の長短よりも主観的な待ち時間の方が重要。渋滞時の合流制限は本当はすごく効果があるが、ドライバーはノロノロとでもいいから動いている方を好むため評判が悪い。逆にディズニーランドのファストパスは実際なんの効果もないが、客の満足度は高い。
第二章は因果関係と相関関係について。疫学調査で少数例の疾患が発生した場合、それはアウトブレイクの兆候なのか、偶発的な発生なのか。クレジットスコアの点数配分はデフォルトの確率をどのぐらい正しく予測できるのか。クレジットスコアについては批判が多いが、実は結構正しくリスクを予測している。(因果関係がなくても相関関係は有用である、という割り切った考えが背景にあるらしい)
第三章は似たようなグループを比較することの重要性、random sampling, stratified sampling について。災害に対する損保は本当は居住地などによって細かく保険率を変更すべき(フロリダでハリケーンに対する保険を募集する場合は相当に高い保険料率でないとペイしないのだが、これを世論が許さないため、事実上内陸部から沿岸部の住民に対する贈り物状態になっている)だがなかなか難しい。米国ではかつて、大学入試で黒人の点数が低いことについて人種差別だ、黒人にも答えられる設問にすべきだという議論があったらしいが、白人と黒人の平均点が違う以上、問題を変えてもうまくいかない(誰でも答えられるような設問か逆に誰も分からないような設問にするしかない)。samplingの段階で能力の不均衡という要因を排除できるようにきちんとstratify する必要がある。その上で同じような点数をとる白人、黒人グループ間で正答率に大きな差(15%以上というのが現在の設定)がある設問を不適切と判定することで入試制度が改善された。
第四章は疑陽性、偽陰性について。ドーピング検査でHctの値が何%以上であれば異常とみなすべきか。低めに設定すれば本来スターとなるべき選手の名誉を傷つける可能性が高くなってしまうので、現状ではやり逃げがでるのは覚悟のうえで高めの値に設定されている。テロ対策の場合は全く逆で、テロの可能性がある人物は一人も見逃さない方向で疑陽性が多くなるようにスクリーニングされる。しかし、現代社会ではデータ量が爆発的に増大しておりアメリカ人一人につき一日10件のデータ(メールとかWeb閲覧とか)という状態でデータマイニングをすると、99.9999%という(ありえないほどに)正確なシステムでも毎日2700万件の警告が発せられることになる。
第五章はまれな事例に着目することの害について。航空事故で死亡する買う率は毎日1回乗って4100年に一度だし、これまでのところ途上国の航空会社のほうが実は墜落事故の確率は低い(国際線の場合。途上国の国内便は事故の確率が高い)。にもかかわらず人々の反応はこれとは全く逆になっている。
投稿元:
レビューを見る
訳がよくて丁寧で読みやすい。統計の入門的な一般書にはいいかも。でも技術者だったら知ってるレベルのこと以上は出てこない。ただ事例はきちんと調査して書いてある感じではある。全般に丁寧なつくりなのだが題名だけヤバい経済学のまるパクリってのはなんででしょ?出版社も大変だねいろいろと。
投稿元:
レビューを見る
110713*読了
この本との出合いはスタバ。
隣に座っていた大学生が読んでいて、気になったので図書館で借りました。
普段は全く意識しないけれど、この世界には数字があふれている。
その数字に対して、さまざまな事例を持ち出し、比較し、分析し、説明を加えていく。
統計について、深く調べたり、裏を探ったり、ということにはあまり興味はないのだけれど、数字が苦手な私でも楽しく読めました。