電子書籍
大変役に立った
2017/06/20 10:56
3人中、3人の方がこのレビューが役に立ったと投票しています。
投稿者:読書灯 - この投稿者のレビュー一覧を見る
とても有益な本だった。
もし書きかけの原稿が手元にあって、これから新人賞に送るかKindleで自費出版するか考えている人ならすぐに使える本だ。自分の本がベストセラーに値するかどうかチェックすることができるだろう。
ただし、長々としたあとがきは読まないことをおすすめする。この本の内容をまったく理解することができていないし、著者の四年間にも渡る努力の上にあぐらをかいて言いたいことを言っているだけの書いている本人だけが気持ちよい独りよがりなあとがきだった。だいたい、この日本人の統計学者は本の執筆にまったく関係ない、突然現れた部外者なのだ。なぜ巻末でこんなものをいきなり読まされなければならなかったのか、腹立たしい限りだ。
紙の本
興味深い
2022/04/11 23:01
0人中、0人の方がこのレビューが役に立ったと投票しています。
投稿者:にゃあ - この投稿者のレビュー一覧を見る
どのような小説が売れるのか、その特徴などを知ることができ、今までこのようなタイプの本は読んだことがなかったので興味深かったです。
紙の本
ベストセラーの中身を数値化する
2018/09/30 18:51
0人中、0人の方がこのレビューが役に立ったと投票しています。
投稿者:J・P・フリーマン - この投稿者のレビュー一覧を見る
アメリカでは、コンピューターのアルゴリズムを使ったベストセラーになる本の解析をするという面白いことをやっているようだ。英文解析ということで、日本の小説にそのまま当てはめることはできない箇所もいくつかあるけれど、ストーリーの緩急を描いたカーブや、主人公の行動はなるほどと思いました。将来的には売れる本、売れない本の判断は編集者じゃなくて、AIがするようになるんですかね?
投稿元:
レビューを見る
最新の自然言語処理技術と機械学習を用いて、「ニューヨーク・ベストセラーズ」にランキングされるために必要な小説の要素を分析した一冊。使われている技術は(基礎研究としては)特にこれといって新奇性のあるものではないし、分析の結果判った「ベストセラーになる要素」も特にこれと言って奇妙なものはない。しかし、基礎研究成果の丹念かつ有意義な応用という意味では非常に興味深い。著者たちはコンピューターが小説を書くことに関してはまだまだ懐疑的だが、良い小説を判定できるのであれば、良い小説を書くところまではもうあと 1ステップだという気がする。
投稿元:
レビューを見る
購入。
アメリカのベストセラーを分析して、その特徴を解説する。
テキストマイニングと機械学習によりニューヨークタイムズ紙のベストセラーリスト掲載書籍とベストセラーにならなかった書籍の違いを分析している。
分析の手法については概要を述べるに留まるので、専門知識がなくても理解できるように書かれている。手法について興味があれば、どのような用語を調べればいいかが解説で案内される。
ジャンルとトピックのどちらを分析に使うべきか、という部分に気づきがあった。また分析には使われていないがBISACという書籍の内容を示すコードがある。この存在を初めて知った。
投稿元:
レビューを見る
印象的な箇所のまとめ
・作家にはその作家特融のトピックがあり、読者はそれを求めている。トレードマークのトピックで3分の1を埋めた後は、残りの3分の2を別のトピックでうめて変化をつければ、それまでの本とは違う印象になる。この方程式はずっと続けてていくことができるし、実際、見事に守られている。大切なのは割合だ。3分の1は同じトピック、3分の2は別のトピック。
・小説の語る内容でなく、小説が体験させてくれる内容に大半の読者は反応する。
・ベストセラーの登場人物は積極的に行動し、感情を表現する。そうでない小説の登場人物は受動的。
・ベストセラーのキャラクターは正しいこtこを正しい方法で行うだけでなく、正しく話す。「彼女は言った」と表現すればすむところを他の言い回しで表現しようとすることは、作家にとっては地獄への第一歩。キャラクターが話す時は文脈で読めるようにすべきであって、派手な動詞で無闇やたらに飾り立てる必要はない。
・ベストセラー作家には女性作家が多い。またライター経験者が多い。ライター経験者は読者に伝わるわかりやすい言葉で小説を書く。
投稿元:
レビューを見る
小説を統計処理するとそれでベストセラーになるのかどうか判断できるか?ってもので、具体的には使われている単語によるセンチメント分析でそのセンチメントのゆらぎがどのように流れるものがよいのか?ってところとか。タイトルとかテーマとかの部分はどこまで?って感じがするけどセンチメントとか、!の用法とか、しゃべるってのの言い方をいくつも使ったほうがよいのかよくないのか?ってところとかがデータを用いて明確にわかるってのはすごい。解説の人はこの本はあまり好きじゃないみたい。ぎりぎりの上手いバランスのところに着地している面白い本
投稿元:
レビューを見る
テキスト・マイニングと機会学習によって、米国におけるベストセラー本が持つ特徴を抽出し、過去に出版された本がベストセラーだったかそうでなかったかをその本の内容(テキスト、文体、トピック等)のみで(尤もらしさとともに)判定するアルゴリズムを開発した研究者による著作。
結果(ベストセラー本である(確率が高いと)とアルゴリズムによって判定された本の特徴)そのものは「なるほど、確かにそうかもしれない」と思われるようなもの(三幕構成のように感情の波がある物語、現実的かつ著者自身が詳しいトピックの選択など)が多いが、それがはっきりと言語化(結果データに対する著者の解釈ではあるが)されている点で深みがあると言える。
データ・サイエンティストを目指す立場の視点としては、最終章で言及されている、将来におけるコンピュータによる著作の可能性や、本研究で用いたアルゴリズムの解説の箇所が面白く、勉強になった。後書きで統計家の西内氏が記述するように、形態素解析後のデータから「Iとhimの距離」のような文章の特徴を考えさらなる加工を行う部分などの計り知れない苦労の上に示された結論であることを踏まえると、著者に対して畏敬の念を覚える。
本書を単純に読みものとして読む場合、本書で紹介されている結論は因果関係を示したものではない(「現状」はいずれのタイミングで変わる可能性が多分にある)という点には注意が必要である。
投稿元:
レビューを見る
500冊のNYタイムズベストセラーとその他のノンベストセラーを読み込んだ傾向と対策の分析。
プロット(感情の上下で示す)に特定のパターンはないが、上下はリズミカルである。もっともそれが優れているのがダヴィンチコードである。多くのテーマはなく、2、3のテーマが物語の1/3までで出てくる。そのテーマは普遍的なもの特に人間関係が多く、複数のテーマ間で対立が描かれることになる。
主人公は、能動的でシンプルな動詞を使う。最近のGIRLが主人公のブームは、女性という今でも制約が多いと思われる状況で、規範から外れた行動と意思を示すことで物語をドライブしていく。
言葉は口語により近く、大仰な言葉遣いは避けられている。設定はあまり関係なく、状況や舞台が物語をドライブすることはない。
投稿元:
レビューを見る
たくさんの切り口があるなかで、何の本なのか、と言う題目は最高位にあると言っていいだろう。たとえば、あなたが友達に本をすすめるとき、あるいはあなたが作家で自分の作品を紹介するときに、真っ先に訊かれるのは「それは何の本なの?」ということだろう。伝記作家でもないかぎり、だれについての本なのか、舞台はどこなのか、いつの時代の話なのか、と先に訊かれることはないはずだ。先立つのは主題への興味である。そこから当然の疑問が生まれる。人の心をつかむトピックとはどういうものか?(p.50)
単語の意味は文脈のなかにあるということだ。「セックス」「ドラッグ」「ロックンロール」もこのセクションの見出しとして描かれていれば、「ジェンダー」「アスピリン」「海辺の楽しみ」と同じ意味でとらえられるかもしれないが、文脈からここでは違うということがわかる。(中略)コンピューターはすべての他の語を文脈のなかで見ることを学ぶ。このように単語を大きな文脈で理解するようにつくられたアルゴリズムをトピック・モデルという。(pp.60-61)
ふたりのベストセラー作家がわたしたちに教えてくれるのは、読者をひきつける大きなトピックがあるということ、それから、2番目以降のトピックは現状を脅かすような衝突を示すものがいいということだ。まったくつながらないばらばらなトピックを配するのはよくない。たとえば、1番目がセクシュアリティーで、2番目がガーデニングといったトピックだと、読み手を引きつける物語は期待できないだろう。その点、ベストセラー作家は抜かりがない。たとえば、子どもと銃、信仰とセックス、愛とヴァンパイア。いずれも実際に売れている。(p.85)
読書をしているとき、本が単なる研究対象ではなくなる瞬間がある。どこか別の世界に連れて行かれて、説明できないある種のトランス状態に陥る、といったらよいだろうか。マルセル・プルーストが「孤独のただなかにあってもコミュニケーションを完結させることができる奇跡」と評した読書にどっぷりつかってしまい、研究対象であるはずの本に理性的に向き合うことができなくなってしまうのだ。そうなると、本が、文章が、そして読んでいる自分自身までもが変質し、「わたし」はそれまでとは違う何かになり、それまで浸ったことのない思考のなかに入りこむ。読書といえば、プルーストのマドレーヌのように思いだす、本によって感情の深いところを揺さぶられる感覚は触知できるものではないが、きわめて身体的なものでもある。(ジャニス・ラドウェイ、p.120)
コンピューターが人間よりも賢くなるというのなら、それは機械的に記憶し、蓄積した事実や情報で測った場合の話である。それはいわゆるブックスマートな人のスキルであって、小説家のスキルではない。小説家に求められるのは創造性や批判的な思考能力である。コンピューターで書いた文章は、短いものなら意表を突かれて面白く読める。おそらく、コンピューター・ライティングの理想というのは、そのあたりにあるのだろう。(p.301)
投稿元:
レビューを見る
LDA(潜在的ディリクレ配分法)でトピックモデリングを実施し、その本にどういうトピックが含まれているか、またその他機械学習で売れている本とそうでない本の違いを解析した結果が書かれている。
アルゴリズムが選んだベストセラーになる確率が一番高い本は「デイヴ エガーズ」の「ザ・サークル」だったそう。
ジョン・グリシャム、ダニエル・スティールは多くのベストセラーがあるが、アルゴリズムでも説明できたんだそう。
ニューヨーク・タイムズのベストセラーリストから売れている小説を500冊ほど、それほど売れてない小説を4,500冊ほど選び、それを学習させモデルを作った。4年ぐらい掛けたらしい
投稿元:
レビューを見る
ベストセラーコード ジョディ・アーチャー、マシュー・ジョッカーズ著
売れる本に共通する特徴は
2017/5/6付日本経済新聞 朝刊
書籍を世に送り出すには越えなければならない3つのハードルがある。第1のハードルはとにかく原稿を完成させることだ。続いて編集者を説得して本にしてもらうハードルが控える。そして最後のハードルは出版した本が世に受け入れられることだ。その客観的なバロメーターになるのが書籍の販売部数にほかならない。
しかし、世の中は理不尽で、鳴かず飛ばずの本がある一方、次々と版を重ねるベストセラー本がある。いったい売れる本と売れない本にはいかなる差があるのか。本書ではこの謎に「ベストセラーメーター」と呼ぶコンピュータ・プログラムで迫る。
2人の著者が開発したこのプログラムは「テキスト・マイニング」と「機械学習」という2つのステップからなる。前者のテキスト・マイニングでは、書籍のなかからテキストの特徴を発見して抽出する。著者らは「ニューヨーク・タイムズ」のベストセラー・リストから小説約500冊を選び、これに売れ行きのよくない小説約4500冊を加え、計約5000冊のテキストをコンピュータに読み込んだ。そのうえで、ベストセラー小説がもっていて、売れない小説にない特徴を特定する。
続く機械学習のステップでは、テキスト・マイニングで見つけた特徴をふるいにかける。著者らが分析したテキストの特徴は2万8000にものぼり、そのなかからベストセラー本がもつ有力な特徴を2799にまで絞り込んだ。研究にはしめて4年の歳月と数千台のコンピュータを要したという。
明らかになった「ベストセラーコード」には次のものがある。まず、親密な人間関係や家庭、仕事など3つか4つの中心テーマが全体の約30%を占める。プロットラインは3幕構成で感情の起伏にメリハリがある。正しい文体で、日常語を使用している。動的でポジティブなキャラをもつ――。あぶり出したこうした特徴に基づいてテキストを分析すると、80%の確率でベストセラー本か否かを判定できるというから驚く。
本書を読み終えてふと思った。近い将来、コンピュータの判定が本を世に送り出すための新たなハードルになるのではないか、と。関係者には必読の書と見た。
原題=THE BESTSELLER CODE
(川添節子訳、日経BP社・2000円)
▼著者はジャーナリストと計量文献学の専門家。
《評》ノンフィクション作家
中野 明
投稿元:
レビューを見る
AIを使ってベストセラーとそうでない本を自動的に文章から分類するアルゴリズムを作ったという話。どんな特徴を持つ本をAIはベストセラーと判断したかという結果よりも、AIを用いて文章から本の良し悪しを見分けるという発想が面白いと思った。
投稿元:
レビューを見る
ベストセラーとなる小説にアルゴリズムは存在するのかをITを使って突き詰めた本。それらしい法則が提示されるが、自分は腹に落ちたわけではない。むしろ、日本語で書かれた小説の場合はどうなのか気になった。言語に関係ない法則(三幕構成にすること、規則的な力強い鼓動があることなど)もあるのだが、それを導いた経緯が説明されないので、なんとなく研究者自身が欲しい結果ありきで結論を出しているかのように誤解してしまう(そのようなことはないのだろうけど)。根拠が乏しいので、納得できないのが残念なところ。とはいえ、その分野の研究は面白そうだ。日本の小説をターゲットにした本を読みたい。
投稿元:
レビューを見る
「ガール小説はこれからも買いだ」
英語で書かれたベストセラーをAIで分析し、何か共通の要素がないかを探した研究。なんと、『フィフティシェイズオブグレイ』にも『ドラゴンタトゥーの女』にも『ハリーポッター』にも通じる共通要素があるというのが斬新。
中でも、第5章にあるノワールな”ガール”についての分析が興味深い。ヒロインは自らの行為主体性を自覚し、何かを必要needし、何かを欲しがってwant自信をもって実行する。実際、needやwantという単語がベストセラーにはそうでない本と比べると多く含まれるのだと分析している。確かに受け身なヒロインより、自分でどこかに旅立って問題に直面する話の方が面白いものね…