短期間、小規模なプレビューをやったあと、Googleは今日(米国時間2/18)、Cloud Vision APIの公開ベータを発表した。このAPIを使ってデベロッパーは、画像認識や分類の機能を自分のアプリケーションに持たせることができる。
Googleの技術は、画像からテキストを取り出す、といった基本的なこともできるが、しかしその真価は、画像中の物を実際に認識できることにある。それはGoogle Photosの画像検索でも使われており、花とか食べ物、動物、各地の目標物などを見分ける。GoogleによるとこのAPIのアルゴリズムは、数千種類の物を認識できるよう訓練されている。
このAPIでいちばんおもしろいのは分類機能だと思うが、でもこのサービスは不適切なコンテンツを指摘することもできる。だからたとえば、写真中心のアプリケーションをPG級(保護者同伴必須)に指定したければ、Cloud Vision APIでそれを指定できる。また、集めた写真の中のハッピーな人だけを見たければ、このAPIの感情分析機能を利用できる。
料金は使い方によって異なるが、たとえば画像中に特定のラベルを見つけたいなら、1000画像あたり2ドルだ。単純な文字読み取りなら、1000画像あたり60セントとお安い。
ベータ中は数量制限があり、一人が1か月あたり最大2000万画像までしか扱えない。すでにプレビューの時点でこのサービスを実装した企業も数社あり、たとえばYik Yakは、このAPIを使ってテキストの取り出しと画像の特徴検出をやっている。
このVision APIは、MicrosoftのProject Oxfordなどと競合することになる(後者は現在プレビュー)。Project Oxfordには、コンピュータビジョンの機能や、顔認識、感情分析などの機能がある。