<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0">
<channel>
  <title>iddy.jp - RSS feeds by HideyaKato</title> 
  <link>http://iddy.jp/rss/blog/HideyaKato/</link> 
  <description>RSS feeds by HideyaKato hosted at http://iddy.jp/</description>
  <language>ja</language>
  <item>
    <title>[adtech] “What Does ‘Demand-Side Platform’ Mean To You?”を前半だけ訳してみた。</title> 
    <description>
    <![CDATA[
    What Does ‘Demand-Side Platform’ Mean To You?(adexchanger.com)がちょっとだけ話題になっているようでしたので前半の「What does DSP (demand-side platform) mean to you?」の部分だけ訳してみました。（注：訳の精度は保証しません、、、のでまちがっていればご指摘下さい。） 　　　　 「Demand−Side Platform(DSP)」とはなんでしょうか？（インタビュー） Jeff Green（Founder and CEO of The Trade Desk） ■「Demand−Side Platform(DSP)」とはなんでしょうか？ Jeff： ・アドテクノロジーに関する残念なことのひとつに「言葉を荒廃させる」ことがある 　　→初めてアドエクスチェンジ（AdECN）を2004年に作った際にその渦中にいた 　　　　→その時の考え：&#8221;We&#8217;ve created an ad exchange and we&#8217;re fair, neutral 　　　　and transparent &#8211; and we run an auction for every impression.&#8221; 　　　　→その後アイデアは広まったが、「アドネットワーク」と「アドエクスチェンジ」の違いがなくなり、 　　　　ほぼすべてのアドネットワークが「アドエクスチェンジ」か「アドマーケットプレイス」に変化した 　　　　　　→「exchange」という言葉が薄まり始める 　　　　→セールストークでは「エクスチェンジにはタイプがあって彼らは違うタイプです」とか 　　　　「私たちの競合は他社エクスチェンジではありません」とかグラグラ [...]
    ]]>
    </description>
    <link>http://feedproxy.google.com/~r/semanalytics/~3/BAohNF0Ials/adtech-what-does-demand-side-platform.html</link> 
    <pubDate>Wed, 11 Jan 2012 11:32:00 +0000</pubDate>
   </item>
  <item>
    <title>本年もよろしくお願いいたします。</title> 
    <description>
    <![CDATA[
    ご挨拶が遅れましたが、本年もよろしくお願いいたします。 去年は自身の関わるCAMPというプロジェクトがその存在を急拡大してなかなか刺激的な年でしたが、今年はその勢いを更に増して行きたいと思います。 今年の抱負は漢字一文字です 「伸」 去年は多くの種まきを行いましたが、今年はそれを大きく「伸ばして」いきます。数少ない国産の「マーケティングプラットフォーム」として、広告配信だけでもなく、広告効果測定だけでもないという強みをさらに伸ばし、CAMPにしかできない価値をつくっていきたいと思います。 また、個人的には息子がどんどん大きくなっているのでその息子の「伸」もあたたかくみていけるよう家庭もより一層明るくしていこうと思います。 昨年も多くの方々にアドバイスやアイデアを頂きましたので、さらに多くの方とディスカッションなどして、デジタルマーケティングにとって良いものを作っていきたいと思っています。よろしくお願いいたします！
    ]]>
    </description>
    <link>http://feedproxy.google.com/~r/semanalytics/~3/Ji9ecdZNVyU/2012greeting.html</link> 
    <pubDate>Wed, 11 Jan 2012 11:18:25 +0000</pubDate>
   </item>
  <item>
    <title>今年もありがとうございました。</title> 
    <description>
    <![CDATA[
    今年も気がついたらもう少しで、本日おかげさまで仕事納めです。 今年はほんとうに色々なことがありました。 前半はエンジニアとして、DBやインフラ系の話の調整。東日本大震災が起こったときはちょうどメンテナンス準備中で、UstreamでNHKを見ながらメンテナンスを実施したのを覚えています。その後はiOSのトラッキングSDKの開発に注力して、大好きなHadoopの勉強をしつつも（後から出てくる）RTBの開発に合流して、ビジネスとテクノロジーの間の子として出来ることを精一杯やらせてもらいました。 僕自身、今関わらせてもらっている「CAMP（CyberAgent Marketing Platform）」のことを本気で好きになった年でもありました。市場感をつかみつつ、広告配信とデータマネジメントのダイナミズムを感じつつ、最高の環境の中で最新のテクノロジーとビジネススキームを組み合わせて「クライアントのために何が提供できるのか？」を必死で考え続けるお仕事。2年前にエンジニアに社内転職したときにイメージしているほどスキルはまだまだですが、着実にプロダクトを進化させていけていると思っています。 CAMPというプロダクトの話をすると、これまで広告効果測定のツールを提供していましたが、その広告効果データを土台にして広告配信機能（第三者配信、Real-Time Bidding）をリリースしました。突然のリリースのように思われた方もいるかも知れませんが、実はもともと予定していた機能で、その構想が元々あったからこそレポートやデータの統合、管理画面の一元化などが実現できています。9月にプレスリリースを出した際のブログにもありますが、 [adtech] CAMPがRTBの実装を経てさらに進化しました http://www.sem-analytics.com/2011/09/camp-rtb.html 企業がマーケティング活動を行うにあたりそのものをすべてテクノロジーでまかなうことはできませんが、せめてその活動の全体像の把握を支援したり、判断をするための仕組み：統合マーケティング（支援）プラットフォームとしての「CAMP」にこだわってこれまで構想を詰めてきました。今後もデータマネジメントや分析、RTBなどの配信を進化させていこうと思っています。まず直近ではひとつの大きな武器としての「RTB」を軌道に乗せてデータを使った価値を広げていきたいと考えています。 今年お会いさせていただいた皆様、本当にありがとうございました。皆様とおはなしをする中で構築されていくイメージが非常に大事な一年でした。来年はより多くの方と機会をいただいて情報交換をさせていただいたり、セミナーなどでディスカッション出来ればいいなと思っています。 すでに来年に向けてたくさんの仕込みをしていますので、どんどん攻めていきたいと思います。
    ]]>
    </description>
    <link>http://feedproxy.google.com/~r/semanalytics/~3/goW5H9fgprI/2011-reca.html</link> 
    <pubDate>Wed, 28 Dec 2011 06:40:29 +0000</pubDate>
   </item>
  <item>
    <title>[adtech] アドテック東京2011のカンファレンス資料公開（ついでにワークショップの資料も共有）</title> 
    <description>
    <![CDATA[
    こんにちは。今年ももうすぐ終わりですね。 もう2ヶ月も前の話になってしまいますが、今年も行われたアドテック東京のカンファレンス資料と音声データの公開が公式サイトにて行われているようです。行けなかった方はもちろんのこと、もう一度確認したい方も要チェックです。 アドテック東京：プレゼンテーション http://www.adtech-tokyo.com/ja/presentations/index2011.html ちなみにカンファレンスではなく展示ブースの方ですが、オムニバス社さんのブースではUstreamをつかって業界のすごい方々がアドテクノロジーやデジタルマーケティングに関して対談形式で生放送されてました。すべて録画されているようですのでこちらも観ていただくとカンファレンスのようにしがらみのないオープンな現場の意見で業界の今後について知ることが出来るかもしれません。 Ustream：e-omnibus http://www.ustream.tv/channel/e-omnibus ちなみに僕自身もアドテック東京ではワークショップで登壇させていただきました。資料の共有をtwitterだけで行っていましたので改めてこちらで共有したいと思います。 広告効果を最大化するためのアドテクノロジーの仕組みと活用のポイント http://www.slideshare.net/jazzyslide/adtechtokyo2011campcyberagent 【adtech-tokyo2011】CAMP_CyberAgent View more presentations from Hideya Kato 概念的な話が多いのですが、まだまだこれまでの業界の認識をそのまま当てはめすぎて本質的な価値を説明しきれていない気がします。もっとこういった機会を増やして議論を重ねていければいいなと思っています。
    ]]>
    </description>
    <link>http://feedproxy.google.com/~r/semanalytics/~3/sKc_azn4rw0/adtech-presentations.html</link> 
    <pubDate>Mon, 26 Dec 2011 04:41:49 +0000</pubDate>
   </item>
  <item>
    <title>ad:tech tokyoワークショップで話します！</title> 
    <description>
    <![CDATA[
    個人的にバタバタとしていて直前の告知となってしまっていますが今年のad:tech tokyoではワークショップの時間にて話をさせて頂く予定です。 現在資料はだいたい出来ているのですがちょっとわかりづらいところがあるのでチューニング中。 内容として、業界のコアの部分はマイクロアドの野口さんにお願いすることにして、僕からはエンジニアとして、さらにはビジネスの現場の人間として、 「各種アドテクノロジーのしくみと、それらを使った場合の広告主のメリット」 をちょっと掘り下げて現場感バリバリでお話しようかなと考えています。 【ad:tech ワークショップ】広告効果を最大化するためのアドテクノロジーの仕組みと活用のポイント 28 October · 12:00 &#8211; 13:00 Details :アドエクスチェンジやオーディエンスターゲティング・Real-Time Biddingをはじめとしたアドテクノロジー活用の動きが日本でも始まっています。 広告効果の最大化のために、広告のリアルタイム入札配信（Real-Time Bidding）、アトリビューション分析、クリエイティブ最適化、ランディングページ最適化、オーディエンス分析など日々進化するアドテクノロジーをどのように活用していくべきなのか。テクノロジーの仕組みと最適化のポイントを分かりやすく解説します。 Speaker : 加藤 英也 株式会社サイバーエージェント CAMP事業部　エンジニア Facebookのイベントページ ワークショップ以外の時間はサイバーエージェント（CAMP）のブースの方にいますのでそちらでお話できる方はぜひブースの方にお越しください！
    ]]>
    </description>
    <link>http://feedproxy.google.com/~r/semanalytics/~3/UF81nD-Bbf0/adtech-tokyo%e3%83%af%e3%83%bc%e3%82%af%e3%82%b7%e3%83%a7%e3%83%83%e3%83%97%e3%81%a7%e8%a9%b1%e3%81%97%e3%81%be%e3%81%99%ef%bc%81.html</link> 
    <pubDate>Wed, 26 Oct 2011 02:18:21 +0000</pubDate>
   </item>
  <item>
    <title>[ #HCJ11F] [Hadoop] Hadoop Conference 2011 Fallに参加してきました</title> 
    <description>
    <![CDATA[
    Hadoop Conference 2011 Fallに参加してきました 日時：2011/09/26 場所：ベルサール汐留 イベントの詳細： http://hadoop-conference-japan-2011-fall.eventbrite.com/ 【重要】イベントのアーカイブ http://mit.recruit.co.jp/hadoop/conference2011fall/info/archive.html 最近さらに注目を集めているHadoopのイベントで、ユーザー会のイベントは思えない規模（1000人over）、リクルートさん協賛による無料イベントとは思えない会場・お昼ごはん・飲み物・アーカイブの提供、非常に豪華なスピーカーの方々などかなり満足度の高いイベントでした。 スライドなどはリクルートさんがなんとこのために作成したというQ&#38;Aサイト「Question VOTE!!」に随時反映されていくようですが、参加したセッションに関してはメモを取りましたのでそれぞれ別エントリーで公開します。 [ #HCJ11F] レポート：The role of the Distribution in the Apache Hadoop Ecosystem [ #HCJ11F] レポート：Apache HBase: an Introduction [ #HCJ11F] レポート：(LT) Lightweight wrapper for Hive on Amazon EMR [ #HCJ11F] レポート：(LT) Hadoop and subsystems in livedoor [ #HCJ11F] レポート：リクルート式Hadoopの使い方 [ #HCJ11F] レポート：Hadoop [...]
    ]]>
    </description>
    <link>http://www.lifexweb.com/tech/2011/09/hcj11f-hadoop-hadoop-conference-2011-fall/</link> 
    <pubDate>Fri, 30 Sep 2011 02:57:57 +0000</pubDate>
   </item>
  <item>
    <title>[ #HCJ11F] レポート：(Lunch LT) パネルログ分析(仮)</title> 
    <description>
    <![CDATA[
    Hadoop Conference 2011 Fall 日時：2011/09/26 場所：ベルサール汐留 イベントの詳細： http://hadoop-conference-japan-2011-fall.eventbrite.com/ 【重要】イベントのアーカイブ http://mit.recruit.co.jp/hadoop/conference2011fall/info/archive.html &#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212; （ランチタイムLT） 『パネルログ分析(仮)』 ブレインパッド 小林 隆 Hadoop Conference Japan 2011 Fall View more presentations from Ryu Kobayashi □パネルログとは？ ・Webログ　→　通常のログ（Apacheなど） ・パネルログ　→　「パネル＝人」ユーザーごとの行動ログ パネルログを分析することで誰がどこに遷移したのか、 その前の行動はなんだったのか、など追うことが出来る。 主に広告代理店などに提供 □構成 AmazonEMRとHadoopMRを併用 ☆Hive,PigとAsakusaの中間のフレームワークがほしい、、、。 Hive,Pigは多段になりがちでパフォーマンスの懸念がある。 ひとつのジョブに多くの処理を詰め込んで段数を減らしている（で、結構大変）
    ]]>
    </description>
    <link>http://www.lifexweb.com/tech/2011/09/hcj11f-brainpad/</link> 
    <pubDate>Fri, 30 Sep 2011 02:52:29 +0000</pubDate>
   </item>
  <item>
    <title>[ #HCJ11F] レポート：(Lunch LT) Hadoopログを全員で使う方法と課題</title> 
    <description>
    <![CDATA[
    Hadoop Conference 2011 Fall 日時：2011/09/26 場所：ベルサール汐留 イベントの詳細： http://hadoop-conference-japan-2011-fall.eventbrite.com/ 【重要】イベントのアーカイブ http://mit.recruit.co.jp/hadoop/conference2011fall/info/archive.html &#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212; （ランチタイムLT） 『Hadoopログを全員で使う方法と課題』 株式会社ディー・エヌ・エー　宵 勇樹 ・Mobageではデータ解析を用いて常にチューニングを行なっている。 データマイニングチームだけではなく一般部署への展開も行っているが、 ・分析ニーズの拡大 ・短期間の納期のものが増大 ↓ ・マイニングエンジニアだけでは手が足りない ・業務内容に関する知識が必要 →Pig,Hiveなどを使ってもいいのではないか？ →データマイニングエンジニアじゃなくても作業できるように △課題 担当する人によって見たいところ、見せていいところが違う →アクセス制限の機構が必要 ○Hueの活用 LDAPを実装し、アクセス制限付きで実行出来るようにした △課題 ・Hueのためのプラグインを作るのが若干面倒 ・Pigのユーザについてはshellがそのユーザで使えるようになっている必要あり ・Hiveのグループ機能はnamenodeの再起動が必要　→LDAPで対応
    ]]>
    </description>
    <link>http://www.lifexweb.com/tech/2011/09/hcj11f-dena/</link> 
    <pubDate>Fri, 30 Sep 2011 02:48:40 +0000</pubDate>
   </item>
  <item>
    <title>[ #HCJ11F] レポート：MapReduceによる大規模データ処理 at Yahoo! JAPAN</title> 
    <description>
    <![CDATA[
    Hadoop Conference 2011 Fall 日時：2011/09/26 場所：ベルサール汐留 イベントの詳細： http://hadoop-conference-japan-2011-fall.eventbrite.com/ 【重要】イベントのアーカイブ http://mit.recruit.co.jp/hadoop/conference2011fall/info/archive.html &#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212; 『MapReduceによる大規模データ処理 at Yahoo! JAPAN』 ヤフー, 角田 直行 吉田 一星 ■Yahoo! JAPANでの事例 ・Yahoo!検索　リアルタイム検索 Twitter社が提供したリアルタイムのツイートデータをABYSS側に送ってインデクシング ・Yahoo!オークション レコメンデーションプラットフォームからHadoopで解析したデータを送信 ■MapReduceによるアルゴリズムデザイン ○空間解析 リバースジオコーダー：位置取得 ☆GeoHash ○検索インデックス生成 検索インデックス＝本の索引 サイト（URL）ごとにキーワードを出す ↓ キーワードごとにサイト（URL）を出せるように【転置】を行う Mapper URLとページの内容を入力として単語を抽出 Reducer 集計 ・課題 インデクスには複数のフィールドがある フィールドごとに単語を分割する方法が違う URL→完全一致 タイトル→2Gram 内容→形態素解析 ユニークな文書番号を付与し、文書番号でソートする 文書内での単語のポジションや頻度を考慮する TFIDFの計算のために単語ごとの文書数と文書ごとの単語数を計算する ○機械学習 データの中で見えているものを手がかりに見えないモノを予測する ページの内容がアダルトかどうか判定する 自分のプロフィールと条件にあったお見合い相手を探す 検索結果を様々な指標にあわせてランキング ・機械学習によるランキング 検索結果を機械学習でランキングする [...]
    ]]>
    </description>
    <link>http://www.lifexweb.com/tech/2011/09/hcj11f-yahoo/</link> 
    <pubDate>Fri, 30 Sep 2011 02:44:53 +0000</pubDate>
   </item>
  <item>
    <title>[ #HCJ11F] レポート：Hadoop 0.23 and MapReduce v2</title> 
    <description>
    <![CDATA[
    Hadoop Conference 2011 Fall 日時：2011/09/26 場所：ベルサール汐留 イベントの詳細： http://hadoop-conference-japan-2011-fall.eventbrite.com/ 【重要】イベントのアーカイブ http://mit.recruit.co.jp/hadoop/conference2011fall/info/archive.html &#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212; 『Hadoop 0.23 and MapReduce v2』 HortonWorks, Owen O&#8217;Malley □Current Hadoop Branches 0.21はstableじゃないから使っちゃダメ ・0.20.203.0 added security MapReduce job limits Performance work ・0.20.204.0 fail in place RPM &#038; Debian package ・0.20.205.0 HBase support ・0.23 Expected to become the next stable release a community effort from cloudera, [...]
    ]]>
    </description>
    <link>http://www.lifexweb.com/tech/2011/09/hcj11f-mapreducev2/</link> 
    <pubDate>Fri, 30 Sep 2011 02:41:10 +0000</pubDate>
   </item>
  <item>
    <title>[ #HCJ11F] レポート：リクルート式Hadoopの使い方</title> 
    <description>
    <![CDATA[
    Hadoop Conference 2011 Fall 日時：2011/09/26 場所：ベルサール汐留 イベントの詳細： http://hadoop-conference-japan-2011-fall.eventbrite.com/ 【重要】イベントのアーカイブ http://mit.recruit.co.jp/hadoop/conference2011fall/info/archive.html &#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212; 『リクルート式Hadoopの使い方』 リクルート　石川 信行 リクルート式Hadoopの使い方 View more presentations from Nobuyuki Ishikawa □Hadoop活用に向けた課題 △現行システムに影響出したくない △開発工数掛けたくない ☆Hadoopまわりのエコシステムを活用する Mahout、Hive、Azkaban&#8230; □Hive ☆リクルート社内ではSQLベース →Hiveとの親和性高い ・WebHive　→　企画職の人もアドホックにデータを出すことが出来る 既存の機能をリプレイスするにあたり →まずは見立てのためにHiveを利用する →さらなる高速化などはMapReduceで書き換えを行う ○Hotpepperの事例 ・1週間分のログからしかレコメンドを計算できず、8万人にしか送れていなかった 1年半分のデータから20万人のユーザにレコメンドが可能に ・アトリビューション分析 □Sqoop (+Oraoop) RDBMSとHadoopでデータを共有する これまでできなかった分析、集計が可能に ○ゼクシィのフェア分析の事例 □Mahout ○ロジックを知らなくても分析できる △ブラックボックスになりがちなのでデバッグが大変 ＋要アルゴリズムの勉強 ○カーセンサー レコメンド用途に利用中 □BIツールへの連携 HadoopでBIツール用のデータを作成→PDCAを高速化 □構成について 最小構成　マスター1台＋slave 5台 Hiveで基本的な整形 →Java [...]
    ]]>
    </description>
    <link>http://www.lifexweb.com/tech/2011/09/hcj11f-recruit/</link> 
    <pubDate>Fri, 30 Sep 2011 02:37:26 +0000</pubDate>
   </item>
  <item>
    <title>[ #HCJ11F] レポート：(LT) Hadoop and subsystems in livedoor</title> 
    <description>
    <![CDATA[
    Hadoop Conference 2011 Fall 日時：2011/09/26 場所：ベルサール汐留 イベントの詳細： http://hadoop-conference-japan-2011-fall.eventbrite.com/ 【重要】イベントのアーカイブ http://mit.recruit.co.jp/hadoop/conference2011fall/info/archive.html &#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212; （LTセッション） 『Hadoop and subsystems in livedoor』 ライブドア　田籠 聡 (tagomoris) Hadoop and subsystems in livedoor #Hcj11f View more presentations from tagomoris □ライブドア 2800+　サーバ 3200+　ホスト 530+　ウェブサーバ 現在15Gbps (10Gbps + CDN 5Gbps)のサービス規模 □Hadoopについて 10ノード（1マスタ＋9） 36コア　32TB　HDFS ・利用中 CDH3b2 Hive 0.6.0 ☆主にレポート作成目的 →super large scale &#8216;sed &#124; grep &#124; [...]
    ]]>
    </description>
    <link>http://www.lifexweb.com/tech/2011/09/hcj11f-lt-livedoor/</link> 
    <pubDate>Fri, 30 Sep 2011 02:26:00 +0000</pubDate>
   </item>
  <item>
    <title>[ #HCJ11F] レポート：(LT) Lightweight wrapper for Hive on Amazon EMR</title> 
    <description>
    <![CDATA[
    Hadoop Conference 2011 Fall 日時：2011/09/26 場所：ベルサール汐留 イベントの詳細： http://hadoop-conference-japan-2011-fall.eventbrite.com/ 【重要】イベントのアーカイブ http://mit.recruit.co.jp/hadoop/conference2011fall/info/archive.html &#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212; （LTセッション） 『Lightweight wrapper for Hive on Amazon EMR』 はてな　田中 慎司 Lightweight wrapper for Hive on Amazon EMR View more presentations from Shinji Tanaka □EMR どんどん増やせる 必要なとき必要な文だけ △課題 1．データをS3にいれないといけない 2．バッチにするの大変 □解決案 1　→　1時間に1回S3に送るスクリプトを実装 ログフォーマット　→　独自SerDe実装 Wrapper　→ Net::Amazon::EMR::Wrapper (PerlにNet::Amazon::EMRがないためRubyのクラスをさらにWrap) □良い点 ・Perlで書ける ・アプリエンジニアにもらくらく ・cron ・HiveQLの恩恵 □大変なところ ・クラスタ管理が不完全 ・S3にデータ展開が大変 ・複雑な処理は大変
    ]]>
    </description>
    <link>http://www.lifexweb.com/tech/2011/09/hcj11f-lt-hatena/</link> 
    <pubDate>Fri, 30 Sep 2011 02:22:05 +0000</pubDate>
   </item>
  <item>
    <title>[ #HCJ11F] レポート：Apache HBase: an Introduction</title> 
    <description>
    <![CDATA[
    Hadoop Conference 2011 Fall 日時：2011/09/26 場所：ベルサール汐留 イベントの詳細： http://hadoop-conference-japan-2011-fall.eventbrite.com/ 【重要】イベントのアーカイブ http://mit.recruit.co.jp/hadoop/conference2011fall/info/archive.html &#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212; 『Apache HBase: an Introduction』 Cloudera Inc, Todd Lipcon □HBaseについて ・オープンソース：Apache 2.0ライセンス ・distributed：1−1000台のコモディティサーバーで稼働 ・ZooKeeperによるフェイルオーバー ・サーバーの追加によるリニアなスケーリング ・Map datastore ・not relational ・row key ・like Map ・Rows are stored in sorted order □カラムファミリについて ・HDFS上で別のファイルとして格納される 異なる特徴やアクセスパターンのデータに適用 ・設定 ・圧縮 ・バージョンをいくつ残すかの設定 ・キャッシュポリシー □アクセス方法 ・Java API ・REST/HTTP ・Apache Thrift ・Hive / Pig [...]
    ]]>
    </description>
    <link>http://www.lifexweb.com/tech/2011/09/hcj11f-hbase-intro/</link> 
    <pubDate>Fri, 30 Sep 2011 02:19:42 +0000</pubDate>
   </item>
  <item>
    <title>[ #HCJ11F] レポート：The role of the Distribution in the Apache Hadoop Ecosystem</title> 
    <description>
    <![CDATA[
    Hadoop Conference 2011 Fall 日時：2011/09/26 場所：ベルサール汐留 イベントの詳細： http://hadoop-conference-japan-2011-fall.eventbrite.com/ 【重要】イベントのアーカイブ http://mit.recruit.co.jp/hadoop/conference2011fall/info/archive.html &#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212; 『The role of the Distribution in the Apache Hadoop Ecosystem』 Cloudera Inc, Todd Lipcon □Hadoopについて Hadoop　→　HDFS（Scalable FS）＋　MapReduce（Distributed Processing） ・巨大かつ複雑なタイプのデータに対しても柔軟に保存、マイニングできる ・経済的にスケール出来る □なぜHadoopなのか？ ・ここ10年でデータは巨大かつ様々なタイプに →さらに柔軟でスケーラブルな解決策が求められた →☆大きなデータを扱うことは困難をもたらしたが、同時にデータの活用という【新たな可能性】を生み出した □利用用途 1．高度な分析目的　（Webの例：ソーシャルネットワークの分析） 2．データ処理　（Webの例：クリックなどの集計処理） □Clouderaについて ・CDH →最も使われているdistribution →安定かつ信頼性は高い（サービス群の依存などもきちんとテストしてある） →オープンソース ・SCM Express（Service and Configuration Manager Express） http://www.cloudera.com/products-services/scm-express/ →CDHを簡単にインストール →WebUIでHadoopの設定を行える →（Expressでは）50ノードまで設定可能 →無料！！！ □導入の流れ [...]
    ]]>
    </description>
    <link>http://www.lifexweb.com/tech/2011/09/hcj2011f-cloudera1/</link> 
    <pubDate>Fri, 30 Sep 2011 02:02:34 +0000</pubDate>
   </item>
</channel>
</rss>
