「honto 本の通販ストア」サービス終了及び外部通販ストア連携開始のお知らせ
詳細はこちらをご確認ください。
紙の本
Rubyによるクローラー開発技法 巡回・解析機能の実装と21の運用例
Rubyでクローラーを開発・運用できるようにするための本。データ収集効率を劇的にアップするクローラー技術をディープに解説。SNSからのデータ収集、企業・株価情報の取得など...
Rubyによるクローラー開発技法 巡回・解析機能の実装と21の運用例
Rubyによるクローラー開発技法
ワンステップ購入とは ワンステップ購入とは
このセットに含まれる商品
前へ戻る
- 対象はありません
次に進む
商品説明
Rubyでクローラーを開発・運用できるようにするための本。データ収集効率を劇的にアップするクローラー技術をディープに解説。SNSからのデータ収集、企業・株価情報の取得など目的別クローラーサンプルも多数掲載。【「TRC MARC」の商品解説】
著者紹介
佐々木 拓郎
- 略歴
- 〈佐々木拓郎〉Web系のシステムアーキテクト。企画から設計開発、運用まで幅広く担当。
〈るびきち〉CUI系フリーライター。著書に「Ruby逆引きハンドブック」他。
関連キーワード
あわせて読みたい本
前へ戻る
- 対象はありません
次に進む
この著者・アーティストの他の商品
前へ戻る
- 対象はありません
次に進む
紙の本
具体例が豊富でわかりやすい
2015/01/31 14:04
2人中、2人の方がこのレビューが役に立ったと投票しています。
投稿者:jojon - この投稿者のレビュー一覧を見る
既製のソフトウェアで目的を果たせるのであれば、わざわざクローラーを自作せずにそれを使用すればいいという考えで、最初に「GNU Wget」というソフトウェアの使い方などが説明されています。そして、その上でなおオリジナルのクローラーを自作したいという人に向けて、「Anemone」や「Nokogiri」といったRubyのライブラリを使用して、様々なWebサイトをサンプルにクローリングやスクレイピングについて具体的に解説されています。
使用している言語はRubyですが、最初の方で簡単にRubyの基礎について触れられており、他の言語の経験があればRuby未経験でも本書で記載されているサンプルコードをある程度苦にならずに読み進めていくことができると思います。環境構築やライブラリのインストールなどについて、WindowsとMacの両方の説明が行われているのにも好感が持てました。
クローラーとは何かという基礎的なことから、クローリング対象のサイトに負荷をかけないようにするにはどうしたらいいか、クローリングの効率化および高速化をどのようにして実現するかといったことまで幅広く記載されており、興味深く読むことができました。