紙の本
文系でも入りやすい内容
2013/10/25 13:26
2人中、1人の方がこのレビューが役に立ったと投票しています。
投稿者:焼菓子 - この投稿者のレビュー一覧を見る
数学が苦手な人でもわかりやすい内容になっています。
もう少し具体的に統計のことを知りたい人のために別途ホームページもあるようです。
表紙からわかるように、登場人物がラノベ(?)のような設定で
読んでいてそこがちょっと気になりましたが、
この本の分かりやすさのためには必要な設定かも・・と思ってそこは目をつぶりました。
投稿元:
レビューを見る
小説でイメージしやすく理解しやすいことを期待して読んでみましたが、初心者には難しい、と感じました。
もう少し敷居を下げて統計について説明してもらえれば、と思います。
小説という視点での感想ですが、著者が言うように初の小説形式で慣れていない印象を受けました。
(意味のないボケと冗長な風景描写が目についてしまいました、、)
キャラは良かったです。
投稿元:
レビューを見る
統計の授業を取っていなかったので、なんとなくだった知識の基礎を確認しておきたかったのと、あとはちょっと某界隈で噂になっていたので購入してみた。
p値についてのイメージや、分析のアプローチ、その妥当性の確認、などを説明していてわかりやすく感じた。
ただ、専門的な統計の入門書というわけではないので、これともう一冊をやらないと実践で使えるという感じではないかもしれない。
とりあえずストーリ仕立てでとても読みやすかった点はポイントが高い。
何のポイントかは自分でもよくわからないけれど。
投稿元:
レビューを見る
普通とばらつき データの特徴を掴もう
平均、中央値、箱ひげ図、四分範囲
平均と分散
正規分布 平均+ー1.96×標準偏差/sqrt(N)
二項分布
相関と回帰 気温から売上を予測しよう
相関、偏差、共分散、t検定、p値
重回帰分析 気温と曜日から売上を予測しよう
調整済み決定係数、F検定
ロジスティック回帰分析 買うか買わないか予測しよう
ロジット、対数オッズ
決定木 特徴を調べる
χ二乗検定
投稿元:
レビューを見る
統計の基本がわかりやすいです。
Rも出てきて面白い。
でも、残念なのは、ここにわけのわからない恋愛話を
交えてしまったことでしょうか。
統計に興味がある初心者の方は読んだ方が良い一冊です。
投稿元:
レビューを見る
登場人物たちも可愛くて、なかなか面白かった。
もうちょっと乱子さんにデレ要素があってもいいのかなーとか思いつつ、おっとこれは統計書だ、危ない危ないと我にかえる。
統計の解説も分かりやすい。
この本、内容もさることながら、なんといってもRのデモプログラム(本書の解説)がついていることにびっくり!(インストール方法などは、本に書いてあります)。
Rを使って、自分で本書内容を追試するんじゃないんだねー
Rでできること沢山あるんだ!やってみたい!っていう気持ちになりますね。
投稿元:
レビューを見る
最近良く巷で聞く「データサイエンティスト」って、実は大半が「統計技師」のことじゃないかと思って、ちょっと買ってみた。
投稿元:
レビューを見る
仕事で統計に関する事業をやる予定なので読んでみた。
大学で習ったような気がする箇所も多いのだけれども、正直よく分からないところが多い。
カテゴリ変数という考えは初めて知った。そうか、重回帰分析をしようと思っても、数値化できないデータがあれば、そういうやり方をすればいいのか。ただ、その使い方はよく分からなかった・・・。
個人的にはRの使い方をもう少し知りたかったとこけど、まあ、Rじゃなくてデータ分析についての本だから仕方ないか。
サポートサイトにはRの使い方(というよりコード)が載ってるので、それみて勉強することにしよう。
http://rmecab.jp/ranko/
投稿元:
レビューを見る
初心者向けというにはちょっと難しいし、恋愛モノには全然なっていないし、むずかしいところ。でも、真面目に統計を勉強する気持ちになれば、初心者レベルとしては、実例を交えてよく書かれていると思う。
投稿元:
レビューを見る
やっぱりストーリーが余計に思えますが,こういうのが分かりやすいと思う人もいるんでしょう。
中央値、四分位偏差、箱ひげ図、平均値、分散、標準偏差、t検定、標準化、F検定、z検定、回帰分析、重回帰分析、ロジスティック回帰分析、決定木、カイ自乗検定
*****
重回帰分析では,説明変数を増やすと,実際に役立つ説明変数であろうがなかろうが,あてはめそのものは無条件に改善してしまうんです。
自由度調整済み決定係数というのは,説明変数が追加されることで無条件にあてはめが改善されてしまうことを差し引いて調整した値です。(pp.142-143)
投稿元:
レビューを見る
データ分析の入口にとkindleで購入したが、改めて表紙を見ると、ポチッたことを後悔した。内容はレベルに合っており、問題なし。小説仕立てで、心おれずに読了できる。続編はの表紙がさらにアレなので、購入を悩んでしまう。
投稿元:
レビューを見る
表紙は・・・ですが、意外と内容はきちんとしています
昔、統計を少し勉強している方に有意義だと思います(復習という意味で、、、)
統計初心者のかたは、少しハードルがあるかもしれません
投稿元:
レビューを見る
ラノベ小説仕立ての統計入門書。
内容は「平均」「分散」「相関」「重回帰分析」「カイ二乗検定」など。
表紙に反し、”統計入門書”として一通り詳しく説明されており、その解説もかなりわかりやすかったように思います。
巻末の「あとがき」で筆者が〈小説は素人〉と告白されています。たしかに物語としてはテンプレ的ですが、純粋に統計入門書として優秀だと思います。
小説の端々に「R(統計ソフト)」が登場しますが、それについての解説はほぼ皆無です。
投稿元:
レビューを見る
弁当の売上分析、売上予測をテーマに書かれた統計本。
銀座のデータサイエンティストというブログでも紹介されています。
物語ベースでの説明になっているため、初心者でも分かりやすく書かれていた。
仮説検定についても分かりやすく書いていたので、
少し理解が深まったように感じた。
【参考になったこと】
・データ分析でみるべきは、平均からのバラツキ。
・帰無仮説とは「係数を0と考えること」で、
係数が0でないことを対立仮説と呼ぶ。
帰無仮説の基で統計量(t値)が計算される確率を求め、
その確率が0.05より小さい場合は、帰無仮説を棄却し、
対立仮説を採択する。
つまり、今回の係数はまずまず信頼出来るという意味。
・回帰分析のときは、予測値と実測値のあてはめの良し悪しを
見る必要があり、このときに使うのが「決定係数」
1に近ければあてはめが良い。
・重回帰分析では、説明変数が多くなるとあてはめそのものは
無条件に改善されてしまうリスクがある。
これをチェックするために、自由度調整済み決定係数を使う。
・自由度とはデータ数からパラメータ数を引いた値。
これだけのデータが揃えば残りが特定されてしまうという意味。
・説明変数間は相関が無いデータを選ぶべき。
例えば、天気と気温は選んではいけない。
多重共線性という問題が起きてしまう。
・カイ二乗検定では、クロス集計表の行列に相関がないかを
チェックする。ロジスティック回帰で行う検定。
・箱ひげ図の上下線が四分位範囲の1.5倍と定義したのは、
正規分布の特徴からである。これで99%近くを網羅するので、
それより外れたデータは外れ値としての検証が必要。
・母集団全体でバラツキを調査する場合は、
データ量で割ってもデータ量-1で割っても変わらないが、
一般的に標本集団でのバラツキを調査することが多く、
標本集団のバラツキは母集団よりも小さくなる傾向にある。
それを補正するために、データ量-1で割る。
これを不偏分散という。
・カイ自乗検定において、クロス集計表に5より小さいデータが含まれるとき、
検定の結果が不正確となることがある。
この場合は、フィッシャーの正確確率等を検討すること。
投稿元:
レビューを見る
標本平均の平均値、標本平均の標準偏差。
中心極限定理
帰無仮説と対立仮説を建てる。帰無仮説を前提とした場合のt値から確率を求める。0.05未満であれば帰無仮説を棄却する。対立仮説が採択される。
ダミー変数(0か1か)。
自由度=データ数からパラメータを引いた数。
決定木。
対数は、右肩の乗数を求めること。