投稿元:
レビューを見る
MapReduceとHadoopでビッグデータの知識が止まっている自分でも(もちろん全てを理解できたわけではないが)読める分かりやすさ。メッセージ配送とストレージを扱った第4章が特に面白かった。第5章のワークフローの話も合わせてMQって当たり前に使ってるけど信頼性を考えると奥が深い。
投稿元:
レビューを見る
技術者としてビッグデータを始めたいときの最初の一冊として良いと思う。
私(ともう一名の仲間)はこれでビッグデータの言葉と意味を覚えて現場に旅立った。
実際、とりあえず読んで理解すれば知ったフリをして話すことができる程度にはなる。
あとはそこから詳しい本を使って覚えていけばいい。
投稿元:
レビューを見る
2019/06/18〜2019/07/18読了
研究室書籍
ちょうど一ヶ月か,,,
データ分析における八割の時間は、データを準備するために費やされる
投稿元:
レビューを見る
一通りデータ処理する基盤構成はわかった。
具体的にデータ分析基盤を作り込むときに、どのような製品を使用するか/どう作り込むかのイメージはまだつかない。
たとえば、
・データレイク/データウェアハウス/データマートのそれぞれの概念はわかったが、それにあたる製品/ツールのマッピングや作り込み方、それぞれの連携のさせ方はイメージがつかない。
・ETLはデータ加工するという概念的なものだと思うが、どのように加工するものなのかわからない(非構造化データを構造化データにすることなのか、それ以外の何かしらの加工も含むのか、、)
など。
実際に手を動かしてみないと、イメージは掴めなそう。