MicrosoftのAzure Media Servicesにビデオの要約を自動作成、タイムラプス生成、ビデオ画面に対するOCRなど、多くの新機能が加わる

cognitive-face-01

ビデオ関連のワークフローを支えるツールをクラウドから提供しているMicrosoftのAzure Media Servicesが、相当賢くなるようだ。今日ラスベガスで行われた2016年NAB show〔放送機器のカンファレンス〕でMicrosoftは、同社がビデオ用の機械学習サービスのために開発したツールの一部を、Media Servicesが利用していく、と発表した。

これによりたとえば、Media Servicesはソースのビデオからいちばんおもしろい部分を取り出したり、ビデオ全体の要約を素早く作って見せたりできる。

また、これらのツールには顔認識の技術や、人間の感情を見分ける能力も加わる。感情の判別は同社のCognitive Servicesがすでに、静止画像に対して行っている 。これらの技術や機能により、たとえば、何かのイベントで行われたスピーチに、人びとがどのように反応したかが分かるようになるだろう。あなたのキーノートがあまりにも長かったら、人びとの感情は、楽しい→無関心→うんざり、と変わっていくだろうね。

Microsoftは今、Hyperlapseというものも作っている。それは、いわゆるタイムラプスビデオをAzure Media Servicesの中へ作り込める機能だ。この機能はすでに公開プレビューをやっており、最初、最大1万フレームまで、という制限があったが、今はない。

そのほかの新しい機能としては、動きの検出、音声をテキストに変換するインデクサーが新たに6つの言語(計8言語)に対応、ビデオ中のテキストに対する動き検出とOCR機能、などがある。たとえば、ふつうの、キーワードによる検索の結果に、ビデオも含まれるようになるのだ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。