先日行われたJTPAギークサロン「hadoopで始める並列データ解析」の当日資料を参加者の藤田さんがブログにまとめて下さいました。
特に当日のwiki資料では説明が少なかった後半を中心に藤田さんより詳しい手順の解説やサンプル処理用ドキュメントの作成方法も追加されています。当日参加された方は是非ご参照下さい。hadoopでS3サービスを利用する部分まで詳しく解説されています。
Hadoopで始める並列データ解析/前編
http://h2plus.biz/hiromitsu/entry/267
Hadoopで始める並列データ解析/後編
http://h2plus.biz/hiromitsu/entry/347