投稿元:
レビューを見る
Rでマルチプロセスで計算するためのパッケージについて。
そのようなパッケージはいくつもあり、4.7章で紹介。これを、フロントエンドにforeachパッケージ(4.11章)をかませることにより統一的に扱う。
全データをオンメモリで扱わない為のパッケージもいくつもある(5章)。Hadoopもこの仲間に入れていい(6章)。
クラスター型のスパコンでRを利用するために、新しく作られている並列処理パッケージもある(7章)。
実例として、巨大データを並列処理していて、どういうスケールでRが使われているか判るものがあればよかった。
投稿元:
レビューを見る
Rは統計分析を行う上で非常に便利な言語だが、幾つか苦手な部分がある。それをどのように補っていくかについて紹介した本。
投稿元:
レビューを見る
並列パッケージの使い方はこの本が一番詳しいですね。
それ以外のところも今後役立ちそう。
必要以上に紙が分厚い!
投稿元:
レビューを見る
当時あまりRの並列処理について書かれているものがなく、いいものがないかと探して見つけたものです。数GB単位のデータセットを扱う方にはおすすめです。最近はもう少し良い並列処理の方法もありますが、まずは基礎的なところを理解した上で最新の方法に挑戦してみてください。