Facebookはいったいどうやって、1日のビデオ表示回数が、18ヵ月の間に10億回から80億回に増えても、サーバーをダウンさせずに済ませたのか。それは、ストリーミング・ビデオ・エンジン、略してSVEと呼ばれている。SVEはFacebookのビデオを小片に切り刻むことによって、アップロードから表示までの遅延時間を10分の1に減らした。また、次世代の360度ビデオやバーチャルリアリティーを高速で読み込むために、新たな幾何学符号形式を発明し、オープンソース化した。
球状のビデオを一般的な正距円筒図からFacebookの仕様で立方体に投影することによって、スマートフォンやパソコン上の360度ビデオはサイズが25%小さくなる。この立方体フィルターはGitHubで公開されている。Facebookは、ヘッドセット用バーチャルリアリティービデオを80%小さくする、ピラミッド画像符号化技術も開発した。
これは、ビデオで好きな方向を見るときでさえ、読み込みを待つ必要がなくなるという意味だ。Facebookはこの新技術を、ビデオのトップ技術者を勧誘するための大胆な取り組みとしてVideo@Scaleカンファレンスで発表した。
これは、ビデオの拠点を巡るFacebookとYouTubeの戦いにとって極めて重要だ。YouTubeでは、ユーザーが意志をもって視聴するので、多少の遅延も許される。しかし、通常ユーザーはビデオを見るためにはFacebookに来ない。ニュースフィードをスクロールするうちに、思いがけず発見するだけだ。読み込みに時間がかかるようなら、すぐにスクロールして他へ行ってしまう。
Facebookはビデオがソーシャルの未来であることを知っている。乗り遅れれば、山ほどのエンゲージメントを導く中毒性のあるコンテンツフォーマットのチャンスを逃がすだけでは済まない。ビデオ広告は驚くほど実入りが良いが、Facebookはフィードにあまり多くのビデオを流したくない。むしろその戦略は、ユーザーが友人の紹介で発見したビデオを見た後に、関連ビデオとして表示することにある。しかし、待機アイコンが回っている間、フィードを読むのを中断しなければならないようなら、何も始まらない。
インターネットにこれだけ多くのビデオがアップロードされるようになり、Facebookはそれを活用する方法を探している。Facebookは人工知能を使った物体や景色、動き等の認識に飛躍的発展を見せている。
人間がAIにビデオのラベルを手動で教えるのではなく、FacebookのVision Understandingチームは、AIが個別のvoxel(ビデオのピクセル)を識別する方法を探求している。
もしFacebookがやり方を見つければ、ビデオに何が映っているかを認識し、誰に見せるべきかがわかるようになる。猫が好き? FacebookのAIが猫のビデオを探してくれる。ボールゲームが好き? Facebookがリアルタイムチャットのための新しいFacebook Stadiumにビデオを送り込む。このためなら広告主は何でもする…少なくともFacebookに大枚を払うだろう。
われわれは、人工知能を持てる者持たざる者の時代へと急速に近づいている。FacebookやGoogleのように先端研究開発に十分な資金を投じることのできる大会社は、それをできない貧しいライバルたちから巨大な利益を上げるだろう。YahooやTwitterのような会社は、もしこうしたAI広告技術を構築できなければ、厳しい時を迎えるかもしれない。そして、出来る者にとっては上昇スパイラルだ。
広告を売る、研究開発に資金を投じる、AI広告技術を開発する、さらに広告を売る、さらに良いAI広告技術を開発する、次世代技術を開発または買収する、未来を勝ち取る。
[原文へ]
(翻訳:Nob Takahashi / facebook)