「honto 本の通販ストア」サービス終了及び外部通販ストア連携開始のお知らせ
詳細はこちらをご確認ください。
紙の本
Apache Spark入門 動かして学ぶ最新並列分散処理フレームワーク (NEXT ONE)
著者 猿田 浩輔 (著),土橋 昌 (著),吉田 耕陽 (著),佐々木 徹 (著),都築 正宜 (著),下垣 徹 (監修)
Apache Sparkの概要からRDDによる処理の仕組み、導入やアプリケーション開発までを解説。SQLインターフェイス、機械学習などApache Spark周辺のライブ...
Apache Spark入門 動かして学ぶ最新並列分散処理フレームワーク (NEXT ONE)
Apache Spark入門 動かして学ぶ最新並列分散処理フレームワーク
このセットに含まれる商品
前へ戻る
- 対象はありません
次に進む
商品説明
Apache Sparkの概要からRDDによる処理の仕組み、導入やアプリケーション開発までを解説。SQLインターフェイス、機械学習などApache Spark周辺のライブラリの活用についても説明する。【「TRC MARC」の商品解説】
Apache Sparkは多数のコンピュータを並列で動かして高速処理を実現する技術です。大量データのバッチ処理や機械学習など、ビッグデータの分野での活用が期待されるOSS(Open Source Software)です。
Apache SparkはUCバークレイで提唱されたRDD(Resilient Distributed Dataset)というデータモデルを採用し、メモリを上手に活用した効率的な処理を実現します。これにより、並列分散処理において高いパフォーマンスが期待できます。また、分散処理フレームワークHadoopとの高い親和性を有しており、YARNやHDFSなどのHadoopシステムの枠組が利用できます。
本書はApache Sparkの概要からRDDによる処理の仕組み、導入やアプリケーション開発までを解説します。また、「SQLインターフェイス」「機械学習」「ストリーム処理」「グラフ」などApache Spark周辺のライブラリの活用についても説明します。
話題のApache Sparkの仕組みとその利用方法を理解することにより、データ処理の新しい潮流を知ることができます。
【商品解説】
本書ではApache Sparkを使うための知識を簡潔かつ実用的に紹介していきます。Apache Sparkは「機械学習」「グラフ処理」「ストリーミング処理」等々を実現するためのライブラリが標準で利用できますが、これらの活用方法も本書で解説します。「インメモリ処理」は今後の大量データ処理で注目される技術です。新しいデータ処理の世界を実現するOSS「Apache Spark」の使いこなしのヒントを満載した初めての描き下ろし解説書を、翔泳社より提供いたします。【本の内容】
目次
- 第1章:Apache Sparkとは
- 第2章:Sparkの処理モデル
- 第3章:Sparkの導入
- 第4章:Sparkアプリケーションの開発と実行
- 第5章:基本的なAPIを用いたプログラミング
- 第6章:構造化データセットを処理する - Spark SQL -
- 第7章:ストリームデータを処理する - Spark Streaming -
- 第8章:機械学習を行う - MLlib -
- Appendix
- A. GraphXによるグラフ処理
著者紹介
猿田 浩輔
- 略歴
- 〈猿田浩輔〉NTTデータ基盤システム事業本部主任。日本人最初のApache Sparkコミッタに就任。
〈土橋昌〉NTTデータ基盤システム事業本部シニアITスペシャリスト。
あわせて読みたい本
前へ戻る
- 対象はありません
次に進む
この著者・アーティストの他の商品
前へ戻る
- 対象はありません
次に進む