XnorのAI2GOは数回のクリックだけでエッジAIをカスタマイズ

AIは、中小企業やその他の業務で発生する大量の日常的なタスクの実行に役立つ。もし自分専用の機械学習エージェントを構築して展開する方法を知っていさえすればの話だが。残念ながらそれを知っている人はほとんどいない。そんな状況の中、エッジベースAIのスタートアップXnor.ai は、非専門家たちがウェブサイトを更新するのと同じくらい気軽に、最先端のAIを動かせるようにすることを狙っている。

同社はAI2GOという名の新しいプラットフォームを立ち上げたばかりだ。これは基本的に、エッジベースAIのための一般的なアプリケーションとハードウェアプラットフォームの組み合わせを一箇所に揃え、ほとんどあるいは全く専門知識なしでもそれらをダウンロードできるようにしたものだ。

創業者でCEOのアリ・ファハディ(Ali Farhadi)氏はTechCrunchに対して次のように語った。「AIの開発は難しいことですし、それができる人はそれほど多くありません。そして、エッジデバイスへの展開はさらに困難です。消費電力、メモリ制限、その他すべてについての心配する必要があるからです。つまり、AIとシステム両方の専門知識を持っていなければならないのです」。

あなたが小さなビジネスオーナーであるとして、仮に自分のレストランに特定の時間に何人の人がいるかがわかったら素敵だと考えたとしよう。幸運を祈りたい。TensorFlowのようにAIをトレーニングして展開するための比較的入手しやすく広く利用可能なフレームワークでさえ、ドメインの専門知識がない人にとっては利用は難しい。AI2GOは、技術的な基本的な知識は持っているものの、自分の目的に利用するカスタムのコンピュータビジョンモデルを構築するために数万枚もの自動車や人間の写真は提供できない人たちを対象としたものだ。

「汎用プラットフォームを使って、ご自身のモデルの訓練を行うことが可能ですが、多くのビジネスやアプリケーションでは、そうした訓練を行う必要はありません。すでにそのためのソリューションが存在しているからです。例えば、駐車場のオーナーならおそらく車の出入りとかそうしたものをモニターしたくなるでしょう」とアリ氏は語る。「AI2GOを使えば、例えば車の認識といったモデルをクリックして、次にハードウェア(例えば、セキュリティカメラチップセットやRaspberry Pi Zeroなど)を選択するだけです。それから、いくつかのパラメータを調整することで、自分の制約条件に合致したXnorバンドルを生成することができるのです」。

この生成されたバンドルは、ユーザーが選択したモデル(群)で構成され、電力またはメモリの制約を満たすようにカスタマイズされた、完全に機能するエッジベースのAIシステムである。ユーザーは指示に従ってそれをインストールすることになる(なおここではソフトウェアの構築と展開についてのある程度の知識が必要となる。このシステムはド素人向けのものではない)、ほんの2、3分ですでに設置してあるカメラを使って、リアルタイムに動作する車検知モデルが手に入るはずだ。そのプロセスは下の図のようにみえるだろう。

ファハディ氏はこのやり方を、Stripeのようなものと比較しながら説明した。もしオンラインショップを始めようとしているなら、支払い処理機構をゼロから構築したくはないだろう。それでも自分の要求に調整された何かは必ず必要だ。同社はすでに企業顧客向けのカスタム高性能エッジAIモデルを作成しているが、中小企業は同じような製品に興味を持つだけでなく、よく似たタスクを抱えていることもわかってきた。

猫の探知機能からジェスチャーの識別に至る、あらゆる領域をカバーした事前に訓練されたモデルがたくさんある。以下に示したのは現在利用可能なもののいくつかの例である。

  • 人物検出機能:カメラが捉えた人物にバウンディングボックスを設定
  • 人物分離機能:人体を検出して背景から分離
  • 表情分類機能:怒り、恐怖、幸福などの表情を読み取る
  • スポーツオブジェクト探知機能:ボール、テニスラケット、スキーなどのものを識別して追跡する
  • アクション分類機能:楽器の演奏、何かを押す、自転車に乗る、登る、走るなどの一般的な人間の行動を見つける
  • 台所用品および食品分類機能:一般的な食品(リンゴ、調味料)ならびに台所用品(スプーン、マグカップ)に対してラベルを付与
  • 車内アイテム検知機能:車の中にある(または置き忘れた)鍵、人、電話、その他のものを追跡
  • 自動車モデル分類機能:自動車の一般的な構造とモデルの識別

この他にも多くのものがあり、異なる目的別に似たような機能がさまざまなかたちで用意されている。車載カメラの人物識別機能は、当然スマートホームやセキュリティで使われる同機能とは異なるものとなる。

現在はまだ、複数種類のアイテムを混在させることはできない。これは新しいハードウェアプラットフォームやユーザー自身のデータを持ち込ませる機能と並んで、今後のバージョンで提供される可能性が高い。

ライセンスモデルは非常に簡単だ。ダウンロードしたモデルは試用あるいは個人的な目的で使用する場合は無料だが、それを商用展開する際にはライセンスを申請する必要がある。コードサンプル付きのSDKが用意されているが、自分自身で構築せずに、単に試してみたい場合のデモもいくつか用意されている。

[原文へ]

(翻訳:sako)

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。