Googleの画像認識/分類API、Cloud Vision APIが誰でも使える公開ベータへ

2016-02-17_1653

短期間、小規模なプレビューをやったあと、Googleは今日(米国時間2/18)、Cloud Vision APIの公開ベータを発表した。このAPIを使ってデベロッパーは、画像認識や分類の機能を自分のアプリケーションに持たせることができる。

Cloud Vision API 2

Googleの技術は、画像からテキストを取り出す、といった基本的なこともできるが、しかしその真価は、画像中の物を実際に認識できることにある。それはGoogle Photosの画像検索でも使われており、花とか食べ物、動物、各地の目標物などを見分ける。GoogleによるとこのAPIのアルゴリズムは、数千種類の物を認識できるよう訓練されている。

このAPIでいちばんおもしろいのは分類機能だと思うが、でもこのサービスは不適切なコンテンツを指摘することもできる。だからたとえば、写真中心のアプリケーションをPG級(保護者同伴必須)に指定したければ、Cloud Vision APIでそれを指定できる。また、集めた写真の中のハッピーな人だけを見たければ、このAPIの感情分析機能を利用できる。

料金は使い方によって異なるが、たとえば画像中に特定のラベルを見つけたいなら、1000画像あたり2ドルだ。単純な文字読み取りなら、1000画像あたり60セントとお安い。

  1. cloud-vision-1.png

  2. cloud-vision-2.png

ベータ中は数量制限があり、一人が1か月あたり最大2000万画像までしか扱えない。すでにプレビューの時点でこのサービスを実装した企業も数社あり、たとえばYik Yakは、このAPIを使ってテキストの取り出しと画像の特徴検出をやっている。

このVision APIは、MicrosoftのProject Oxfordなどと競合することになる(後者は現在プレビュー)。Project Oxfordには、コンピュータビジョンの機能や、顔認識、感情分析などの機能がある。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。