memo ∞ 「ツイッターでトレンド入りするトピックスを1時間以上前に予知／MIT」　

SJN ‏@SJN_News

MIT、ツイッターでトレンド入りするキーワードを1時間以上前に予知するアルゴリズムを開発 http://sustainablejapan.net/?p=2725 pic.twitter.com/salJTwjr

MIT、ツイッターでトレンド入りするトピックスを1時間以上前に予知するアルゴリズムを開発 « SJN Blog　再生可能エネルギー最新情報

Graphic: Christine Daniloff

マサチューセッツ工科大学（MIT）が、ツイッターで「トレンド入り」するトピックスを1時間以上前に予知するアルゴリズムを開発したとのこと。95％の精度で予知できるという。

平均で1時間半前には予知できる。4〜5時間前から予知できる場合もある。ツイッターの広告リンクに対して大きな利益を与える可能性のあるアルゴリズムだが、それだけではなく、時間の経過に伴って変化する量であれば何にでも応用できる統計分析手法であるといえる。例えば、バスの乗車時間、映画のチケットの売上げ、株価などにも応用可能であるという。

すべての機械学習アルゴリズムと同様、このアルゴリズムも「訓練」される必要がある。訓練では、過去にトレンド入りしたトピックスとしなかったトピックスのデータセットを精査し、意味のあるパターンを見つけ出す。特徴的なのは、これがノンパラメトリックな方法、すなわち、パターンの形について一切の前提を置かないものであることだという。

研究チームの電気工学・コンピュータ科学准教授 Devavrat Shah 氏によれば、標準的な機械学習では、推定のために必要なパターン形状についての一般的仮説があらかじめモデル化されている。ツイッターでトレンド入りするトピックスでいえば、最初は少ない数のつぶやきが続き、ある時点で投稿数が大きくジャンプする段階がくるというシンプルなモデルが作れる。しかし、こうしたモデルを使って訓練を行う場合、どれがジャンプしそうなトピックスなのか研究者には分からないという問題がある。そこで、今回のアルゴリズムでは、どのトピックスがジャンプしそうかをデータ自身に決めさせるようにした。

具体的には、同アルゴリズムでは、新しいトピックスについてのつぶやき数の経時変化を訓練用データセット内のすべてのサンプルの経時変化と比較する。新しいトピックスとあるサンプルの統計値が似ている場合には、トレンド入りを予測する上でそのサンプルに重みをつける。このように重みづけを行ってから、新しいトピックスがトレンド入りするかどうかをすべてのサンプルに投票させる。重みづけが異なるので、あるサンプルの投票は他のサンプルよりも多くカウントされる。投票結果は合計され、新しいトピックスがトレンド入りする可能性についての確率的予測値が出される。

実験では、トレンド入りしたトピックス・しなかったトピックスそれぞれ200個のデータからなる訓練用セットを使用した。実際のツイッター上でアルゴリズムがリアルタイムに動くようにしたところ、95％の精度でトレンド入りを予知できた。トレンド入りしなかったトピックスをトレンド入りすると誤判定した割合（偽陽性率）は4％だった。訓練用のデータセットの規模をもっと大きくすれば精度はさらに向上するという。

（発表資料）http://bit.ly/UjAJuJ MIT News

memo ∞ 「ツイッターでトレンド入りするトピックスを1時間以上前に予知／MIT」

Trending Articles

モーツァルトディヴェルティメント変ホ長調 K.563 の名盤

井上貴博アナウンサー彼女や結婚の噂は？実家や親が話題？人気は？

Ke Aloha Kalikimakaの歌詞を和訳します

PaliのLepe `Ula`ulaと歌詞の和訳

2014年6月6日号　三菱東京ＵＦＪ銀行（5月14日付）

LNK2019:未解決の外部シンボルと LNK1120:外部参照 1 が未解決について

ヴァンパイア・ノーツ　攻略

大阪・泉南イオンで飛び降り自殺とみられる転落事件が発生：ネットで拡散された理由とは

メールディーラーで受信するアドレスを追加できますか？

Robocopy のエラー (戻り値) について

林要の結婚や経歴&評判とWikiプロフやLOVOT(ラボット)とグルーブエックス株価は

【極☆寒】「凍った髪」を競い合う『国際ヘア・フリージング・コンテスト』！寒〜い写真に身震いしつつ過ぎ行く冬にサヨナラだ!!

滋賀の部落（同和地区）一覧

【銃刀法違反】吉田総業組長代行恩田達志容疑者を再逮捕

和歌山県代表決まる　都道府県対抗中学バレー

大浦街道で重体事故

【世界大学ランキング】第１位にジュリアード音楽院とウィーン国立音大、日本勢は？

【対策済】「SKYSEA Client View」のアップデートに失敗する問題についてのお知らせ

Lahaina Lunaの歌詞を和訳しました

画像・写真】ららぽーと横浜で16歳男子高校生が転落死不審な動き→逃走し警備員に追いかけられ→柵越え飛び降り・12m転落窃盗・万引き？それとも盗撮？