テキストデータの統計科学入門

著者金明哲（著）

統計的テキストマイニングの知識とスキルを、フリーのソフトウェアと具体例を用いて解説する入門書。統計的テキストデータ解析に焦点を絞り、統計学の基礎から、近年提案されたデータ...

紙の本

テキストデータの統計科学入門

税込 4,180 円 38pt

+

このセットに含まれる商品

前へ戻る

対象はありません

次に進む

商品説明

統計的テキストマイニングの知識とスキルを、フリーのソフトウェアと具体例を用いて解説する入門書。統計的テキストデータ解析に焦点を絞り、統計学の基礎から、近年提案されたデータマイニング手法まで紹介する。【「TRC MARC」の商品解説】

著者紹介

金明哲

略歴: 〈金明哲〉１９８８年中国より来日。総合研究大学院大学統計科学専攻博士後期課程修了。同志社大学文化情報学部教授。博士（学術）。著書に「Ｒによるデータサイエンス」など。

あわせて読みたい本

この商品に興味のある人は、こんな商品にも興味があります。

前へ戻る

対象はありません

次に進む

この著者・アーティストの他の商品

前へ戻る

対象はありません

次に進む

みんなのレビュー（3件）

みんなの評価2.7

レビューを書く

評価内訳

星 5 (0件)
星 4 (0件)
星 3 (1件)
星 2 (1件)
星 1 (0件)

紙の本

総花的で薄味な入門書

2016/01/30 23:38

1人中、1人の方がこのレビューが役に立ったと投票しています。

投稿者：市井の数学愛好家　-　この投稿者のレビュー一覧を見る

本書は小説、新聞、ブログ、日記等のテキストデータを解析する際に良く使われる手法を紹介している入門書です。

本書では様々な統計量や統計的手法が取り上げられていますが、少ない紙数の中に無理やり押し込んだ為か、統計量や統計的手法を列挙しただけで解説らしい解説が殆ど無いため、読了後、個々の手法について全く印象に残りません。

さらに本書では統計量や統計的手法について「多用されている」「多く用いられている」という言葉を頻繁に使い紹介していますが、それらがなぜ多く使われるのか、その説明が全くありません。例えばデータの類似度に関して、一般的にはピアソンの相関係数が使われているがテキストの処理ではコサイン類似度の方が多用されている、と記載されています。しかし肝心の理由は一切述べられていません。当然ですが、多用されるからにはそれ相応の理由があり、理由を知ることは統計量や統的手法への理解にも繋がるはずです。

新しい統計量が登場したときに簡単な数値例を使い手計算を示すことで読者の理解を促すといった入門書らしい良い側面も一部に見られますが、初学者を専門領域へといざなう入門書という観点から見ると、残念ながら力不足と言わざるを得ません。本書をさらっと眺め終えたら、本格的な書籍で学びなおすことをお勧めします。

このレビューは役に立ちましたか？ はいいいえ

報告する

2011/08/04 22:07

投稿元：ブクログ