投稿元:
レビューを見る
グーグル検索などのデジタル自白剤で得られたビッグデータでわかった人間の本性。
ひとは、アンケート調査に対しては嘘をつく。
貧困層の多い町からは有力スポーツ選手は出にくい。
農村人口の多い地域のほうが、精神的に不安を抱えているひとが多い。
書き間違いは、性的な潜在意識を表すものではない。
夫婦が異なる趣味、異なる交際範囲を持っている方が、離婚する率が低い。
オバマは、人種差別によって不利益を被っていた。
男は性器の大きさに悩み、女は性器の臭いに悩む。
私はXXXとセックスしたい、という検索の4分の3は、母親とのセックス願望。
女性は、自分の話題に同調し、共感してくれる男性を好む。相手のことを尋ねてきたら、話題が尽きた証拠。
親は性別で子供を差別している。男児には知性を求め、女児には容姿を求める。
実は、リベラルも保守も同じようなニュースサイトを見ている。
子供が8歳のときに流行っていたスポーツが生涯の好みのスポーツになる。
データの絞り込みで得られる真実。所得階層の流動性は、アメリカ全土では高くないが、非常に高い地域もある。
多くの富裕層が住んでいる地域の住民は、(その人自身が貧困でも)長生きできる可能性が高い。
教育費支出が高いと、子供が中の上くらいまで豊かになる可能性が高まる。大学町、大都市、移民が多い地域は、超有名人が出る確率が高まる。
A/Bテストで分かる真実。
有力学校にギリギリで受かった子供とギリギリで落ちた子供の、成人後の所得水準は大して違わない。
ビッグデータでも、成果が出ない分野もある。すでに徹底的な調査・分析が行われれいる分野、例えば、証券投資分析など。
投稿元:
レビューを見る
人間はアンケート調査のとき、匿名でも嘘をつく(社会的望ましさバイアス)。セックスの回数を多く申告し、人種差別はしないし偏見もないと答える。しかし、コンドームの消費される数を調べるとじっさいのセックスの回数が少ないことが分かるし、「nigger」とググるひとはまだまだいる。
直観はしばしば頼りになるが、バイアスは避けられない。夫婦関係は共通の友人がいたほうが長続きするように直観的には思えるが、それは間違っている。バスケ選手は貧しい地域から生まれるような気がするが、中流が出身の選手の方が多い。
ビッグデータは1.新しいデータをもたらし2.正直なデータをもたらしい3.部分集合に絞り込みやすく4.比較対象試験が手軽にできる。
ビッグデータを使って何かをするときの教訓1.データが重要視されていない領域に乗り込む2.予測がなぜ正確になるのかを説明できる必要はない
データから分かることいろいろ。SNSでは自分の幸福を盛る。暴力的な映画は暴力的な人間を隔離し、アルコールから遠ざけることで暴力犯罪を減らす。一部の女性は暴力的なポルノについて検索する。パートナーがセックスに応じてくれないという検索は女性の方が多い。学校の教育方針は生徒の今後を予測しない
投稿元:
レビューを見る
競走馬の話は面白かった。因果関係と相関関係は違うから注意って話はまあ当然出てくるんだけど、最近テッド・チャンのメッセージを読んだ人間としては、タコ型異星人としての考えとしての因果ではない次元を想定しちゃうよね。ストーリーからポジションと俯瞰へというか。成功者になろうというロールモデルよりは、どういうポジションを取るのか。ベル・カーブのどこらへんを想定するのか。その場合にはどれくらいの浮き沈みがあるのか。まあVRで成功者の物語は体験できるしその逆もできるのだからそもそも実体的な成功にどんな意味があるの?とか、エリックフォッファー?
投稿元:
レビューを見る
人の表層的な建前と、データの矛盾が具体的に示されていて面白かった。ビッグデータからどこまで人の医療や経済の要求や流行を読み取れるようになり、今後の戦略的なマーケティング等に影響を及ぼすものになり得ると考えると興味深い。
自分の見ているものが、本質的に果たして正しいことか疑う視野を持ちたい。
投稿元:
レビューを見る
ビッグデータだけではダメだというくだりが興味深かった。
野球の守備は数値化が難しいので、無視したら弱くなった話とか。
投稿元:
レビューを見る
「僕のペニスの大きさは?グーグル検索が教える人間の本質」
これが本書のもともとのタイトル案である。
————以下、ほぼ下ネタ————
検索ワードのビッグデータ分析について、その面白く驚くべき(予想外の!)結果を中心にまとめられた本書。
利用されたのはグーグルを中心にフェイスブック、ポルノハブなど
(*私はポルノハブを利用したことはありません)
本書では、性的なものをはじめ、政治、経済、食事、医学、社会、ギャンブル、野球、犯罪、エンタメなど広範なテーマについて様々な角度から、検索ワードのビッグデータ分析と考察がされている。
その中でも、単語の量とテーマの文章量だけでいうと、圧倒的にセックス関係のものが多い。
セックス関係のビッグデータ分析からわかったことは
(掲載順。文章の後ろの数字はページ数)
•「セックスレス 結婚」の検索回数は「不幸 結婚」の3.5倍、「愛のない結婚」の8倍多い 17
•女性は、男がペニスについて検索するのと同じくらい陰部について検索し、その最大の関心は、その悪臭と対策 33
•インドでは授乳関連の検索が世界一多い。具体的には「夫は私に授乳してほしいのか」の検索数と、男に授乳しているシーンを含むポルノの検索数 (後者はバングラデシュも同等) 33
•アメリカでは「天気」より「ポルノ」の検索数の方が多い 129
•男性によるポルノハブ上の検索の1.4%はペニスのある女性について 141
•女性によるポルノハブ上の検索の25%は「痛ましいアナル責め」や「公衆の面前での凌辱」、「極端に暴力的な輪姦」などの女性への暴力行為関連。性暴力系の検索率は女性が男性の2倍。(もちろん検索と実際の願望は単純に結びつけられない) 141
•男性は臓器の中で性器について一番検索する 144
•男性はペニス増大術をタイヤの交換方法やオムレツの焼き方よりも検索する 144
•オーラルセックスのテクニックについて、女性は男性の2倍検索する 148
•男性は女性をイかせる方法と同じくらい自分にフェラする方法を検索する 149
など。
ほかのテーマも非常に興味深い観点と結果なので、ぜひぜひご覧頂きたい。
私達の直感、経験、印象、常識などと、検索のビッグデータ分析とが大きく解離していることがつくづくわかる。
ただ、自分が普段いかに嘘をつきながら社会で生きているか。そしてパソコンやスマホにだけ本当の気持ちを吐露しているか。それを自分の胸に手をあててそれを少し考えれば、それも納得はいく。
今後も人文科学、社会科学的な学問を深めるのに、検索のビッグデータは最重要の情報の一つと言わざるを得ないだろう。
もちろんビッグデータ分析にも様々な注意点や限界がある。
個人情報保護や個人への介入などとのバランス取りは最たるものだ。
そのような注意点や限界についてもしっかり記載しているのが、本書を優れたものにしている。
ビッグデータ分析についての一歩目の本として、それ以上に私達人間の知られ��る本音について、知るために優れた本である。
投稿元:
レビューを見る
誰もが嘘をついている
セス・スティーヴンズ=ダヴィドウィッツ
2018年2月20日発行
読んで、なんだか嬉しい
ビッグデータの活用の例を届けてもらえた
ビッグデータ解析が可能にしてくれたのは社会科学であり、行動科学の分野での新たな一面を見出してくれる事だろう
Googleでデータ・アナリストをしていた著者が
検索ワードをはじめとした、さまざまなビッグデータのデータセットを分析している
Googleのワード検索データから読み取れるのは、例えば 本を最後まで読んでくれる確率だ
90%が完読したと推定される
ドナ・タートの ゴールドフィンチという小説もあるが、経済学などの書籍の完読率は5%前後だ
たいていは最初の50Pまでで読んだ事にされていると言う
だから、この本の結びの項では、推敲を重ねるより飲みに出た方が得策だと締め括ってる
検索ワードの組み合わせが重要なのは理解できる
健康医療関連での例が引かれている
すい臓癌の場合
消化不良と検索してから、腹痛と検索する人は すい臓癌になるが
消化不良と検索してから、腹痛と検索しない人にはすい臓癌と診断される人はいなかったという
社会経済学でも社会調査に基づく研究がなされていて、例えば貧困とキラキラネームは関連性が高いことや
性生活で使用されるコンドームの数量などの試算データもあるそうだ 男女での回答の集計には11億個と16億個という開きがあり、さらにコンドームの実売数は6億個だと調査がある
嘘だらけだというのはこうした、アンケート回答など表向きの言葉は正確なものではないということだ
そこでGoogle検索ワードの活用に意味が出てくる
セルゲイ ブリンとラリー ペイジ Google創業者
が作ったリンク重視の検索システムが他の検索システムと差別化した優位点だった
これは新聞社のサイトは信用性が高いという証でもある
Google検索には新聞社のサイトからのリンクが重要だったからだ
この検索をするワードこそが人の本性を示しているビッグデータとなったのだ
人は常に嘘をついている
もしくは都合の良いことだけを言っている
Facebookなどを見ればわかりやすいだろう
SNSは秘密の上に成り立っていると言う
本性を表すようなことは言おうとしないのが人間なのだ
でも自分ひとりだけの時に検索するワードには本性が滲み出てくる
NetflixもAmazoのグレナードリンデンも、見たがりそうな情報をレコメンド:推薦する方法を選んだのは、自分が見たいものを質問しても本当に見てくれるとは限らないからだ
人は自分にも平気で嘘をついているのだ
デジタル自白剤という言い方でネット上のシステムを表現した
その効能は、
◆不安や気恥ずかしい行動を抱えているのは自分だけじゃないと自信を持たせてくれる
◆苦しんでいる人に気づかせてくれる
◆最も強力な価値は、問題を解決へと導く力
だと言う
◆◆◆ 多くの実験 ◆◆◆
ビッグデータの価値のひとつは、絞り込んだ上でパターン抽出もできること
小規模なサーベイでは決してできないことだ
例えば、貧困層の長寿は富裕層が多く住んでいるエリアであることのみが、相関因子であると言う
また出世する確率は出生地大きく起因していると言う
大学町と大都市だ かつ移民人口の多い事だ
少なくともアメリカでは、これが明らかな偏りとしてあるそうだ
逆に影響を与えない変数として驚くのは、自治体の教育費支出だった
Googleで、妊婦がよく検索するのは、
妊婦は○○をして良いか?
というものだ
国別で見ると
アメリカ 小エビを食べる
イギリス エビを食べる
オーストラリア クリームチーズを食べる
ナイジェリア 冷水を飲む
シンガポール 緑茶を飲む
スペイン パテを食べる
ドイツ 飛行機に乗る
ブラジル 髪を染める
日本はどんなワードなんだろう
◆ 暴力映画の公開後は、犯罪が減る
◆ 医療に役立てようと試みる研究者たち
アイザック コハネ、ジェームス ヘイウッドなど
◆ ビルゲイツが研究資金の提供を申し出た実験
インド農村部の教師に出勤手当の加算をした場合の欠勤率の低下と生徒の学力向上を調査した研究だ 識字率が7%上昇
◆ A/Bテストの容易な実施
◆ テレビ広告は、やっぱり効く
◆ 実験できない事象もある
例えば、指導者が暗殺された国で何が起こるか?
宝くじのように偶発的なもの
大学の合格者と落ちた人の差
ビッグデータで証券市場を予測できるか
IQを遺伝子研究で予言できるか
実験結果としては、お門違いであることを証明しただけだったさそうだ
ビッグデータもスモールデータで補完する必要がある 、、、
いや、むしろビッグデータを使ってスモールデータで検証されたことを補完することが重要だとした
倫理的にビッグデータの活用に適さないこともある
活用すべきでない局面もあることを理解するひつようがあるということを強調している
投稿元:
レビューを見る
ビックデータから分析できるもの、わかることを説明する本
まあコラムの集合としては良いかなレベル。冗長感がある。
ビックデータを用いることで多くの部分集合を見つけ出すことができる。そこから統計的な傾向を見ることができる。
ビックデータは大きな集合なのでいくつものランダム化試験を見つけ出すことができる。特に検索結果トレンドは本人の興味というなかなか表に出せないものを見いだせる
投稿元:
レビューを見る
基本的にはビッグデータで人間の潜在的な傾向がわかる。新しいデータ間の相関関係を調べることはビジネスや政治に利用されている。もちろん実行と検索は違うからビッグデータの傾向で全て判断してはいけないとも書いている(殺人に関する検索は殺人の実行と違うとの例など)。ビッグデータ利用がますます増えるIT社会の今に読むべき良書。