サイト内検索

詳細検索

ヘルプ

セーフサーチについて

性的・暴力的に過激な表現が含まれる作品の表示を調整できる機能です。
ご利用当初は「セーフサーチ」が「ON」に設定されており、性的・暴力的に過激な表現が含まれる作品の表示が制限されています。
全ての作品を表示するためには「OFF」にしてご覧ください。
※セーフサーチを「OFF」にすると、アダルト認証ページで「はい」を選択した状態になります。
※セーフサーチを「OFF」から「ON」に戻すと、次ページの表示もしくはページ更新後に認証が入ります。

送料無料(~1/31)

1,000円以上の注文で3%OFFクーポン(0120-26)

hontoレビュー

予約購入について
  • 「予約購入する」をクリックすると予約が完了します。
  • ご予約いただいた商品は発売日にダウンロード可能となります。
  • ご購入金額は、発売日にお客様のクレジットカードにご請求されます。
  • 商品の発売日は変更となる可能性がございますので、予めご了承ください。

みんなのレビュー9件

みんなの評価4.0

評価内訳

  • 星 5 (3件)
  • 星 4 (5件)
  • 星 3 (0件)
  • 星 2 (0件)
  • 星 1 (1件)
9 件中 1 件~ 9 件を表示

電子書籍

取っ掛かりとして良い

2016/02/28 12:33

0人中、0人の方がこのレビューが役に立ったと投票しています。

投稿者:らった - この投稿者のレビュー一覧を見る

データ分析とRの使い方の両方の入門者にとっては、入り口として様々な要素が盛り込まれているので、取っ掛かりとして良い本だと思います。

このレビューは役に立ちましたか? はい いいえ

報告する

2014/12/31 11:22

投稿元:ブクログ

秋に購入したにも関わらず、全く読めてなかった著書。
銀座のデータサイエンティストというブログを投稿されている著者が、
R言語を使いながらデータ分析とはなんぞや?
を初心者でも分かるように書いてくれています。

仮説検証以外は、それほど難しい内容ではないので、
取っ掛かりとして読んでみるのは良いと思います。
また、R言語自体フリーなので、実際に手を動かしながら
読み進められるのは良いと思う。

前処理部分については触れていないので、
こんな手法があるんだってのを理解するにはお勧めです。

【勉強になったこと】
・R言語は内部構造的にif文、for文の実行が遅い。
 そのため、出来る限りapply関数など直接ベクトルや
 マトリックスに一括して同じ処理を当てはめるような
 R固有の処理を用いるべき。

・ばらつきの重なり具合を考慮したうえで、お互いの大小を
 比べて判定するというメソッドを「仮説検定」という。

・対立仮説が全くの偶然から正しいと判定されてしまう確率を
 「有意確率」という。
 有意確率が0.05(5%)を下回っていたら、統計的に意味があると言われている。

・順位データのばらつきは生データの分布と無関係に
 どれも似たような分布になる。
 この性質を使った仮説検定をノンパラメトリック検定という。

・カイ二乗検定は外れ値に弱い。
 何故なら、正規分布に従っているという前提があるから。
 それを超越するのがノンパラメトリック検定(順位和検定)。

・回帰とは、
 ある「目的となるデータ」(売上高・利益・来客数・クリック数etc.)を
 さまざまな「独立な周辺データ」(気温・曜日・月・景況・キャンペーン
 ・サイト導線・クリエイティブ広告etc.)から「説明」すること。
 前提として、
 ①「独立な周辺データ」は基本的にはお互いに影響を
  及ぼすことができない
 ②「独立な周辺データ」→「目的となるデータ」なる因果関係がある

・一般的には重回帰分析が用いられるが、
 Yes/No, パーセンテージのような上限・下限が決まっている場合、
 得られる結果が歪んでしまう。
 そのような制約のあるデータに対しても重回帰分析を行えるようにしたのが、
 「一般化線形モデル(Generalized Linear Model:GLM)」

・教師あり学習の種類
 ①識別モデル
  単純パーセプトロン、ニューラルネットワーク、
  SVM、Passive-Aggressive法
 ②生成モデル
  ナイーブベイズ分類器、ベイジアンモデリング
 ③樹木モデル
  決定木、回帰木

・SVMの特徴といえば、
 「マージン最大化」と「カーネルトリック」
 Rでは、e1071を使うのがお勧め。
 理由としては、e1071パッケージには、
 SVMのオープンライブラリとして有名なLIBSVMが実装されており、
 実はPython/Java/C++といった他のプログラミング言語と
 全く同じ内部アルゴリズムで動くようになっているから。

・アソシエーション分析の代表的な評価指標3つ
 ①Support(支持度)
  全体の中における出現率(XもYも購入)
 ②Confidence(信頼度)
  Xを購入した人がYも購入する確率
 ③Lift(リフト)
  Xを購入した人がYだけを購入した場合に比べて、
  どれくらいYを購入してもらうことに貢献しているか?

・Aprioriアルゴリズムは米Amazon社を初め、
 さまざまなWebサービス基盤において急速に普及している
 レコメンデーションシステムの基礎アルゴリズムとして
 用いられている。

・モデルなしで、多くの変数を少ない変数に集約するのが
 主成分分析。
 モデルありで、多くの変数を共通因子にまとめるのが
 因子分析。

・一般にニューラルネットワークはさまざまなパラメータを
 チューニングすることでいかようにも分類性能を変えることが
 出来る一方で、容易にオーバーフィッティングを起こすことから
 「職人芸」的な機械学習メソッドとされていた。
 これを覆したのがDeep Learning。

2014/10/18 10:44

投稿元:ブクログ

他のレビューにあるようのに基本的な内容から上級者向け内容が混在してしまっているのかもしれない。
個人的には各種方法論が網羅されていて便利ではあると評価しますが、個別に興味のある統計学の本にて掘り下げる必要があるか。

2015/04/05 18:35

投稿元:ブクログ

文字通り、一通り手を動かしながら様々なデータマイニングを試せます。テーマがビジネス向けであることと、手を動かせる工夫がされていることが、非常に価値があるように思えます。
ただし、全体的に入り口の部分の案内となっているので、深めるには別の書籍などが必要です。

2014/11/01 18:55

投稿元:ブクログ

本書はデータマイニングの概略本である。Rの操作方法も一部載っている。本書はあくまで概略本であるため、この本一冊でデータマイニングの各論やRの操作方法がマスターできるわけでは到底ないので注意が必要。しかしながら、概略本としては現在のマーケティングで使用される分析手法などが掲載されている数少ない本であるという意味で良書だと思う。

2014/08/12 08:31

投稿元:ブクログ

2014年8月22日発売予定、
http://gihyo.jp/book/2014/978-4-7741-6674-2
銀座で働くデータサイエンティストのブログ』ではてなブックマーク1000以上を獲得した人気記事,「Webデータ分析&データサイエンスで役立つ統計学・機械学習系の分析手法10選」(http://tjo.hatenablog.com/entry/2013/06/10/190508)をベースに,単行本として全面的に書き下ろしたもの。
2014年8月12日Amazonへ予約注文した。
2014年8月26日1日かけて、読了した。
機械学習の概要をつかめた気がするが、自力で行うには相当な勉強と訓練が必要となるだろう。

2016/03/11 08:39

投稿元:ブクログ

文字どおり手を動かしながら読み解く本だと思う。
例が現実的でイメージしやすい内容なので、とてもわかりやすく良いと思う。自分はアソシエーション分析あたりから、ちょっと頭の中だけでは理解できなくなってきた。
辞書として使うには不十分だと思うけれど入門書としてはかなり良いのではないか?と思った

2014/11/11 18:05

投稿元:ブクログ

「とりあえず統計学を学んでみたものの、実際にどう活用できるかわからない」「ビックデータがどうビジネスに役立つのか」という疑問を持つ向きにオススメの一冊。以前5万円+それなりの交通費を払って東京までデータサイエンティストの講義を受けに行ったことがあったが、それよりもっと濃い内容を、たったの1980円+税で学ぶことができる画期的書物である。回帰分析から検定まで、統計学の基礎がわかっていればスラスラ読めると思うが、適宜解説がついているので初心者が読んでも大丈夫な作りになっている。

内容はRというフリーソフトを使って、コードを入力しながらデータ分析をしていく演習形式だが、私は「Rを使うと重回帰分析がこんなに簡単にできるんだ…!」とか「決定木を使うとこんなに視覚的にわかりやすい表現ができるんだ…!」とか「ランダムフォレストを使うと将来の予測までできるんだ…!」とか、いちいち感動した。終章(第10章)だけは、少ないページ数に猛烈に高度な内容を詰め込んでいるので理解できない箇所があったが、それ以外は文句なし。表紙の「データ分析の基礎から最新の手法までをやさしく解説したいちばんわかりやすい入門書です。」という言葉に異議なし。

2014/10/11 08:45

投稿元:ブクログ

微妙な本です。買う価値はないでしょう

Rであれば他の専門書のほうが良いですし、分析事例も微妙で他のデータ分析本で十分です。つまり、この本の「売り」が分かりません

少なくとも、Rを実務で使っている私はそのように感じました

読んでいて本当に知りたいことは「他の本に譲る、、、」的なことが連発し、どうでも良いことを「自慢げにたらたら語る、、、」という感じで配慮の無さが随所に感じられます(ちょっと残念)

他の本に譲っていてばかりなら、この本の価値はありません

著書のことは知りませんが、おそらくビジネス経験が少ないのだと思います

ビジネス経験がつけば、すごいことになるかもしれませんが、、、

9 件中 1 件~ 9 件を表示