Hadoop

前回はHadoopのインストールで、今回がいきなり実用的な内容で、ちょっと基礎を飛ばしてますが、気にしない。 レコメンドというと、パッと思いつくのはAmazonのレコメンドではないでしょうか。 商品を見ていると、「この商品を買った人はこれも一緒に買っています。」といった感じの物ですね。 今回はこのレコメンドを簡単に実装する方法を探ってみます。 まず、解析後に欲しいデータとして あるアイテム(item1)に対して、関連するアイテム(item2,item3,item4)をひもづけるデータです。 デー ...

Hadoop, ubuntu

そろそろHadoop入れてみようか。 ということで、例のごとくVMware PlayerにUbuntu11 64bitをインストールして、そこにHadoopを入れてみます。 Ubuntuのインストールなどは省略 Hadoopというのは、Apacheで開発されているオープンソースの大規模データの分散処理です。 詳しくはHadoop( ではさっそくインストール。 HadoopはJava上で動くので、まずはJavaを入れます。 本家(から、とりあえず最新版のJDKをダウンロードします。 /usr/lo ...