紙の本
誰もが嘘をついている ビッグデータ分析が暴く人間のヤバい本性
2019/04/15 07:53
0人中、0人の方がこのレビューが役に立ったと投票しています。
投稿者:lakini - この投稿者のレビュー一覧を見る
ネタバレ
ビッグデータの利点
性的嗜好など、表のデータとして得られないものが得られる、正直なデータが得られる、膨大な規模でデータが手に入るため、小さな部分集合に絞り込んでも比較可能なサンプルサイズになる、手軽に比較対象実験ができるため単純な相関関係だけでなく因果関係が検証できる。
予測することだけが目的なら、理由まで分かる必要はないから。データサイエンティストは今まで謎に人力で予想していた分野に出ていくといいことがある。そして、人がこれまで意識していなかった指標(データ)に目を向けること。
もう、すべてはこれだと思う。
俗に思われるアメリカの人種差別傾向が強い地域と、実際みんながそういう内容を検索する地域は異なっているとか、有効な演説内容か否かはその聴衆がその瞬間にググッている単語で判別し得て、その効果たるや一般人が直感で抱く方向性と異なるかも、とか。とにかく、グーグルなどの検索データのビッグデータの活用可能性の示唆に富む本。データの活用先をマーケティング等に限定しないところが面白い感じじゃないかな。それに、ちゃんと統計学の基礎に沿って書かれていて、安心感がある。
投稿元:
レビューを見る
伝統的な統計手法では分からなかった人々の真実を、グーグル検索データをもとに暴いた本。統計やSNSでは、人々は無意識に見栄を張りがちである。一方で、人々はGoogle検索上は本音を吐き出す。
・インドでの意外な性癖は衝撃的だった。
・Google検索の画期的なところは、単純に検索ワードの数の多さで重要リンクを判断するのでなく、参考リンクの多いサイトが人々が求める最も重要な情報源と整理したところ。
・フェイスブックで2006年にニュースフィードを作った時、ユーザーは大反対したものの、マークは実は人々がニュースフィードを気に入っていることを知っていた、というのは興味深かった。人々の回答と潜在的な行動は異なることがある。それを知る一つの手がかりはネット上の行動パターンとなる。確かアマゾンも、属性情報はマーケティング部には一切公開されず、似たような人々の行動パターンでおススメ商品を提示していると聞いた。
・アメリカで贔屓の野球チームがいる場合、大体その人が8歳の時にそのチームがワールドシリーズで優勝している。政治的意見も、それが決まる過程に相違はない。多くのアメリカ人は14-24歳(特に18)の間に人気のあった大統領に多大な影響を受ける。
・人格形成期に正しい都市で成長することは、将来の経済力に大きな違いをもたらす。大学都市で出生した場合、子供が立身出世する可能性が高まる。2番目には大都市を含む群。
・ABテストの有効性。(ネットの依存性が高まるというデメリットあり。)これによると、テレビ広告は目に見える効果がある。
・同レベルの人達であれば、行く大学によって将来の収入に大きな差は出ない。
検索結果のビッグデータは使いようによってはビジネスチャンスやより良い予測(特に病気の兆候や診断など)に活用できそうだ。新しいアイディアを考えるには面白い本だった。
投稿元:
レビューを見る
グーグル検索という行動が示す人間の本性をあらわにした本。テーマとしては差別、ポルノ、SEX、政治が多い。結局みんなそういうのが大好きだということ。
投稿元:
レビューを見る
ビッグデータには4つの効果がある。
①新種のデータ
②範囲を絞り込める
③正直なデータ
④比較試験が容易にできる
そのうえで著者は、フロイトだったり、走る競走馬などの話を面白おかしく書いている。ただ著者はビッグデータには限界があるとも書いている。変数が多すぎると、あまりにも複雑化しすぎて、偶発性が高くなり、信用ができないとする。また、あくまで数字化した部分が対象なので、そこから漏れるものも出てくる。つまり人間の補完として使用するのがベストであるとしている。
投稿元:
レビューを見る
ビッグデータの利点
性的嗜好など、表のデータとして得られないものが得られる、正直なデータが得られる、膨大な規模でデータが手に入るため、小さな部分集合に絞り込んでも比較可能なサンプルサイズになる、手軽に比較対象実験ができるため単純な相関関係だけでなく因果関係が検証できる。
予測することだけが目的なら、理由まで分かる必要はないから。データサイエンティストは今まで謎に人力で予想していた分野に出ていくといいことがある。そして、人がこれまで意識していなかった指標(データ)に目を向けること。
もう、すべてはこれだと思う。
俗に思われるアメリカの人種差別傾向が強い地域と、実際みんながそういう内容を検索する地域は異なっているとか、有効な演説内容か否かはその聴衆がその瞬間にググッている単語で判別し得て、その効果たるや一般人が直感で抱く方向性と異なるかも、とか。とにかく、グーグルなどの検索データのビッグデータの活用可能性の示唆に富む本。データの活用先をマーケティング等に限定しないところが面白い感じじゃないかな。それに、ちゃんと統計学の基礎に沿って書かれていて、安心感がある。
投稿元:
レビューを見る
Googleの検索履歴を用いた社会分析の研究者として、Googleのデータサイエンティストの職にも就いていた著者が、最も人間の欲望や本当の姿が赤裸々に表現される検索ワードで、どこまでの分析が可能かをウィットに富んだ語り口でまとめた1冊。
分析対象としている検索ワードには個人を特定する識別子はない(付加されている属性は、言語・IPアドレス等から識別される国籍、性別等のレベルである)ため、分析の多くは個人ではなく集団を対象としたものになる。そのため、分析のアウトカムとしては広告のようなものではなく、教育・医療・福祉などの公共政策の有効性を検証する類が多い。例えば、
・不況と児童虐待の関係性(検索ワードにおける児童虐待・ネグレクトに関する投稿データから)
・人種差別的なニュースと人種差別の相関性
などである。
こうした公共政策への示唆は、昨今の「エビデンスに基づく政策決定(Evidence-Based Policy Making)」に興味がある人にとって有益だと思うし、興味がある方には手にとって頂きたいと思う。
なので、ぜひ本書の邦訳出版元である光文社は、「エビデンスに基づく政策決定」が必要な、小池百合子氏に100冊ほど献本されてはどうだろうか。
投稿元:
レビューを見る
人の考えていることはわからない。全てをさらけ出して生きていける人はほとんどいない。
社会を多くの人が住みやすくするために、データを使う。これまでは簡単には手に入らなかったビッグデータを使う。データサイエンティストは大切な仕事だ。
投稿元:
レビューを見る
匿名であったり誰も見ていないときほど、本音が出る。そこを拾い上げる仕組みができ、様々なことがわかったり、より予測がしやすくなったりしたのは、よいと思う。
差別というのは無くならないものなのだなあ。
投稿元:
レビューを見る
著者はGoogleの検索データをもとに、統計分析を行い、いかに人々が周りの目がないときには正直になるのかを明らかにした。ことさら、セックスと人種差別に関する検索ワードからわかる事実はいくぶんか衝撃的でもあるが、ある意味では予想に沿ったものでもあった。著者は、「グーグル検索こそ、人間心理についてこれまで収集された最も重要なデータセットだと確信している」ーなぜなら「グーグルのデータの価値が非常に高いのは、規模が大きいからではない。人々が真情を吐露している」からだ。
ー たとえば、「トランプ支持が最も強かった地域は、「ニガー」という語を最もよく検索していた地域だったのだ」ということがデータ分析の結果として明らかになってしまう。
ー たとえば、「米国では「天気」よりも「ポルノ」の検索のほうが多い」という不都合な真実も明らかにされる。
ー たとえば、「妻が夫をゲイなのではないかと疑うことは案外多いこともわかっている。彼女たちはそれを、驚くほど共通の検索フレーズ――「私の夫はゲイか?」――で調べている。「私の夫は……」検索において、「ゲイか?」はそれに次いで2番目に多い「浮気しているか?」よりも10%多い。「アルコール依存症か?」よりも8倍、「鬱か?」より10 倍も多いのだ。何より啓示的なことに、夫がゲイなのではないかと疑っている女性の人口比は、寛容性の低い地域のほうがずっと多い」ということもわかる。
ー たとえば、「失業率が1%上がるたびに、「児童虐待」と「児童ネグレクト」の検索は3%上がっていた」という形で貧困と虐待の相関性が明らかになる。
今般、ビッグデータ分析の重要性が叫ばれているが、重要なのはその量ではなく、質であると著者はいう。その意味で、それぞれのOTTが集めているデータの質の違いにも着目されるべきである。「フェイスブックはデジタル自白剤ではなく、「自分はこんなにいい暮らしをしていると友人にデジタル自慢させる薬」」だし、ネットフリックスは「人の言葉を信じるな、行動を信じろ」といった上で「アルゴリズムは本人よりもよくその人をわかっているんだ」と付け加える。
なお、「借金希望者の言葉遣いが、返済率の強力な予言因子になる」こともわかる - 「神に言及した人は2.2倍も借金を踏み倒しやすい」らしい...。
投稿元:
レビューを見る
検索から、わかるさまざまなこと。間違いなくデータサイエンス、行動経済学は、今後ますます主流になっていくことが具体例とともに伝わってくる。それプラス、著者のユーモアあふれる筆致がとてもよかった。アマゾンの書評で引用される文章が、本の前半のものと後半のもの、どれくらいの割合になっているかで、その本の完読率を割り出す。自らの本は、その結果、完読されない類の本ですよ。っていう終わり方がとても洒落ていた。
投稿元:
レビューを見る
主に検索データに基づく、人間の性向を捕捉する試みを記述。検索という行為はパーソナルなもので、その人の次の行動を予測し得る。ハーバード大学の卒業生の平均年収は高いが、ハーバードに受かったが他の大学に行った人(同じレベルの学力を示唆する)の年収も実は同レベルだった。トップ高校にぎりぎりで入った人のその後の大学の進学先は、ぎりぎりで落ちた別の高校に入った人たちと大きく変わりはない。
単純な相関関係を見るとビッグデータは次元の呪いにはまりやすく、データセットが増えるごとに高相関であてはまっているデータが増大する。単純にデータを増やすのではなく、どのデータが有効そうかを考えて選択しないといけない。
投稿元:
レビューを見る
レビューはブログにて
https://ameblo.jp/w92-3/entry-12397288850.html
投稿元:
レビューを見る
トランプ氏が大統領になったのは大番狂わせだと言われているが、グーグルの検索データを分析するとそうでもないらしい。口では人種差別をなくしましょうと言っているが、裏では差別的な単語を検索したりしている。みんな日常的に嘘をついているのだ。最近ではビッグデータが誰にでも手に入るようになったので、様々な可能性を秘めているが、逆に分析する人間のばいあがかかったりと問題がいろいろありそうだと感じた。この本の著者はご家族が仰られるように変人だと思った。いろいろ頑張れ!
投稿元:
レビューを見る
ビッグデータで何がわかるか?というのを具体的に教えてくれる。
多くのデータが集まる程、カテゴリー分けができて細かい分析ができるというのが興味深い。多くの変数をそれより少ない観察数で分析すると、あやまった因果関係や相関に翻弄される。観察数の数がビッグなのがポイントなのである。
以下 具体例の数々
Googleの検索は口ほどに物を言う。アンケート調査では現れない本音の欲望や悩みを分析すると・・・・
人種差別とトランプの当選
男女の性的悩み
景気と児童虐待は 公的調査結果と反対の結果に・・・
名門校にぎりぎり入れた人と落ちた人の将来比較
スーパーボールの広告効果の金額は・・・・3億の広告費で8億売りあげ増
プロ野球チームのファンになる理由は少年期のチーム成績
ABテストはオバマの政治資金収集にも役に立った
左心室の大きな馬は大成する。
投稿元:
レビューを見る
人は、アンケートにはついつい見栄を張ったりやウソをついてしまう。
でも、検索窓にウソはつかない。
だからGoogleの検索履歴とかを分析すれば、かなり真実に近い人間の嗜好が読み取れるぞコレ!!
という本。
それはいいんだけど、それにしても性的な話が多過ぎないか。そんなにそこ重要?確かにウソをつきたくなりやすい分野だから、特徴が出やすいとは思うけどそれにしてもだ。人間ってそんなにセックスに支配されてるかなぁ?
ということで、1/3くらい読んだところでもういいやってなった。
ふと、30年も前に読んだブライアン・キイのメディア・セックスを思い出したよ。