AWSのRekognition APIはセレブを認識する――Amazonの機械学習がさらに進歩

Amazon RekognitionはAWSが提供する深層学習を利用した画像認識、分析のサービスだ。今日(米国時間6/8)、Rekongnitionがさらに賢くなった。このサービスは政治、スポーツ、ビジネス、エンタテインメント、メディアなどさまざまな分野の著名人の顔を認識できるようになった。

私はGoogle検索で見つけたいくつかの顔写真(コメディアンのコナン・オブライエン、歌手のジャスティン・ビーバー、知名度さまざまな俳優、女優など)をRekognitionに入力してみたが、すべて認識された。GoogleとMicrosoftが提供している同種のサービスと同様、デベロッパーはAPIを通じてRekognitionを利用するが、AWSのアカウントを持っている読者はこちらでデモを体験できる。

Rekognitionはセレブの顔認識に成功すると、可能な限り、IMDBのページにリンクする(IMDBはAmazonの子会社なので当然だ)。

現在のRekognitionは顔認識だけでなくユーザーが提供するデータに基づいて画像の文脈を認識し、被写体の感情、人口動態的分類ができるが、新機能によってサービスがさらに強化された。

ちなみにGoogleのVision APIには現在まだセレブの顔認識機能はないが、MicrosoftのComputer Vision APIにはある。Microsoftによれば20万人の著名人の顔認識ができるということだ。私がテストしたところでは、Microsoftのサービスの顔認識精度はAmazonとほぼ同様だったが、画面に写っている他の対象についても情報が提供され、これに基づいて写真のキャプションを作ることができた(「スーツにネクタイのジャスティン・ティンバーレイクがカメラに向かって笑っている」など)。

〔日本版〕Rekognitionの画像中の物体の認識、表情分析などの例。MicrosoftのComputer Vison APIはDescriptionで内容に関するキーワードを返してくる。

[原文へ]

(翻訳:滑川海彦@Facebook Google+

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。