電子書籍
ビッグデータを支える技術 刻々とデータが脈打つ自動化の世界
著者 西田 圭介
(概要)多彩な技術の集合体。ビッグデータの今。スマホで買い物をして,翌日には届けてもらえる。たとえば,このような身近な場面でも,背後では決済/在庫管理/配送をはじめとした...
ビッグデータを支える技術 刻々とデータが脈打つ自動化の世界
ワンステップ購入とは ワンステップ購入とは
ビッグデータを支える技術 刻々とデータが脈打つ自動化の世界 (WEB+DB PRESS plusシリーズ)
商品説明
(概要)
多彩な技術の集合体。
ビッグデータの今。
スマホで買い物をして,翌日には届けてもらえる。たとえば,このような身近な場面でも,背後では決済/在庫管理/配送をはじめとした複数のシステムが連携して動いています。
コンピュータの性能向上に伴い,機械学習をはじめとした,データを活かすシステム開発への期待は高まる一方です。今後,システム規模の大小を超えて「データ処理そのものをシステムの一部とする」技術への需要は増していくでしょう。
データ処理をどのようにシステム化するか。
本書ではこのエンジニアリングの問題に主軸を置き,可視化を例に,一連のデータ処理に必要な要素技術を整理しデータを効率良く扱うための土台を作り,その上でシステムの自動化をサポートする種々の技術を追っていきます。
(こんな方におすすめ)
・データ処理基盤/ビッグデータを扱うエンジニアの方々
・作業を自動化したいとお考えのデータサイエンティストの方々
・広くデータを扱う業務に携わる方々で,データ処理の効率化について知りたい方々
・「データ処理のシステム開発とはどのようなものか」に関心のある方々
(目次)
第1章 ビッグデータの基礎知識
1.1 [背景]ビッグデータの定着
1.2 ビッグデータ時代のデータ分析基盤
1.3 [速習]スクリプト言語によるアドホック分析とデータフレーム
1.4 BIツールとモニタリング
1.5 まとめ
第2章 ビッグデータの探索
2.1 基本のクロス集計
2.2 列指向ストレージによる高速化
2.3 アドホック分析と可視化ツール
2.4 データマートの基本構造
2.5 まとめ
第3章 ビッグデータの分散処理
3.1 大規模分散処理のフレームワーク
3.2 クエリエンジン
3.3 データマートの構築
3.4 まとめ
第4章 ビッグデータの蓄積
4.1 バルク型とストリーミング型のデータ収集
4.2 [性能×信頼性]メッセージ配送のトレードオフ
4.3 時系列データの最適化
4.4 非構造化データの分散ストレージ
4.5 まとめ
第5章 ビッグデータのパイプライン
5.1 ワークフロー管理
5.2 バッチ型のデータフロー
5.3 ストリーミング型のデータフロー
5.4 まとめ
第6章 ビッグデータ分析基盤の構築
6.1 スキーマレスデータのアドホック分析
6.2 Hadoopによるデータパイプライン
6.3 ワークフロー管理ツールによる自動化
6.4 クラウドサービスによるデータパイプライン
6.5 まとめ
あわせて読みたい本
前へ戻る
- 対象はありません
次に進む
この著者・アーティストの他の商品
前へ戻る
- 対象はありません
次に進む
小分け商品
前へ戻る
- 対象はありません
次に進む
この商品の他ラインナップ
前へ戻る
- 対象はありません
次に進む