2011年4月30日土曜日

情報爆発 成果報告会 2日目 2011/3/10

喜連川先生のお話(領域1)
  • eBay、毎日1000エクサバイトの情報を処理している。だから、リーマンショックでも売上が落ちなかった。
  • 企業のシステム投資でもサーバーとストレージの割合が変化しており、年々ストレージの割合が高くなっている。
  •  TSUBAKI++は、検索に時間が掛かるが、WHYサーチとしては世界初なのではないか。このようなレスポンスの遅いサービスでもマネタイズの仕組みが必要。

松本先生のお話(領域2)
  •  手間を考えれば、クラスターは共通で作るべきだった。
  • 現在、inTriggerでは、2200CPU
  • inTriggerでTsubameとの連携が可能。

TSUBAMEについて
  • 以前は、 HDDアクセス<<<ネットワークアクセスだったが、SSDなどの登場によりそうでもない状況になってきた。
  • Metaデータサーバーのアクセスの局所性を利用して早くしていくしかない。

TSUBAKI, TSUBAKI++について
  • 日本語の文書1億件が検索対象
  •  InTriggerにこれから載せる。
  • MS Azureの上にCygwinを載せて、その上で動かしている。
  • 形態素解析→構造解析→同義語解析→上下関係のフレームワーク などが実装されている。
その他、言語処理関係
  • 隠語を探す研究
  • 根拠を探す研究
  • 以外でありながら重要なことを探す研究


パネルディスカッション 
  • データが主役というプロジェクトのテーマの選び方は、5年前に考え出されたテーマとしては素晴らしかった。まさに時代を先どっていた。
  •  学者立ちはどうしても、個々でシステムを組みたがる。それを、防ぐために支援班を作ったこともよく考えられていた。
  • if else で書けないもののに対する研究が欠けていたのではないか?スパコンを使っても、ショウジョウバエの脳のシミュレーションすらできない。 

2011年4月24日日曜日

new context conference 2011/04/16 at デジタルガレージ

基調講演
JOIさん
  • 最初の数時間はtwitterしかなかった。
  • 基本的にはインターネットしか残ってなかった。
twitter  senior scientist Abidalさん
  • 地震のときに、個人あてのメッセージが10倍になった。
  • 日本 海外 1000 messages / min
  • 日本国内 11000 messages / min
セッション
メディアとTwitter
最初のニュースソースとして、twitterはあり。
しかし、その後はContextはマスコミが作っていく。マスコミの報道をリツィートするような方向で話が進んでいく。
その他のメディアの動き
NHKがUStreamの放送を追認した形となった。
アメリカでは、グーグルよりもソーシャルメディアからの流入のほうが2倍おおい。

放射線測定のセンサーネットワーク 
  • 人間こそがセンサー
  •  発電所内とそこから離れたところでは、必要なデータが違う。アルファ線、ベータ線、ガンマ線は、それぞれ違うセンサーが必要。
  • 現在の報道では、数字が1つしか報じられないが、それはあまりに物事をシンプルに捉えすぎている。
  • 政府や東電も数字を発表するが、民間が発表する数字も同時に必要。それらがお互い補いあう形となる。
  • 放射線の量は、場所が少し違うだけでも結構違う。だから、民間にカウンターを普及させることが重要。また、その情報を共有するネットワークが重要。
  • データを測定する人→集める人→配信する人→解釈する人 の長いパイプリレーが必要となる。

2011年4月17日日曜日

NHKスペシャル 世界ゲーム革命(2010年12月放送)

ゲーム業界全体の流れ
  • いまや映画産業を抜いて、世界1のエンタメ産業
  •  ゲームエンジンによるゲーム作成の効率化
  •  マーケティングにかけるお金は減りつつある。面白けば誘導は色々ある時代になった
  • スタジオジブリや、スピルバーグもゲーム製作をバックアップしている。
エンザイム社(ゲームのユーザーテスト代行業)
  • プロテクターを200人集めている。(すべての人種、性別を網羅)
  • テストは制作費全体の2割から3割
  • ヘッドギアをして、集中力を脳波から測定。飽きるポイントを見つける。