米国時間3月30日、Google(グーグル)の社内インキュベーターであるArea 120がStackという最新のプロジェクトを公開した。Stackは書類やレシートなど家中に散らばっている紙をデジタル化し、自動でGoogleドライブに保存するアプリだ。さらにこのアプリはスキャンした書類の名前と適切なカテゴリー、つまり「スタック」(束)を推測する。
Stackで請求書やレシート、身分証明書など、さまざまな大きさの書類をスキャンし、PDF化して整理できる。そしてファイルに含まれる重要な情報がAIテクノロジーで詳細に読み取られる。
Stackのアイデアを考えたのは、EdTechのスタートアップで2018年にグーグルに買収されたSocraticの共同創業者であるChristopher Pedregal(クリストファー・ペドレガル)氏だ。
関連記事:Googleがモバイル学習アプリSocraticを買収してiOS版を再提供
Socraticではグーグルのコンピュータビジョンと言語理解テクノロジーを活用して高校生の学習を支援していたとペドレガル氏はいう。同氏はグーグルでこのテクノロジーを書類の整理にもっと活用するにはどうすればいいかと考え始めた。このアイデアを実験するために、同氏はMatthew Cowan(マシュー・コーワン)氏と組んだ。2人はまず、膨大な書類を分析するAIテクノロジーを手がけるGoogle CloudのDocAIチームで仕事をした。
2人は企業向けのDocAIのテクノロジーを個人の書類にも応用できると考え、これがStackの開発につながった。
StackアプリはAndroid版が米国で公開された。書類の写真を撮るとアプリが自動で書類に名前を付け、適切なカテゴリーのスタックに入れる。カテゴリーには請求書、銀行、家、身分証明書、入国、保険、法律、医療、ペット、レシート、税金、旅行、クルマ、仕事などがある。
1件の書類をスキャンする際に複数のページを含めるとStackは書類内のページをすべてOCR処理するので、全文を検索できる。重要な書類にすぐアクセスできるように星をつける機能もある。
写真を撮ってすばやく書類をデジタル化する機能は目新しくはない。例えばMicrosoftは何年も前からOffice Lensを提供している。しかしStackでは請求書の「期限」や「合計金額」「口座番号」といった重要な情報を書類の中から認識できるようになる予定だ。認識された情報が取り出されて後から見つけやすくなる。
書類のタイトルだけでなく全文を検索して必要な情報を見つけられる。Stackの書類を守るためにGoogleドライブと同様に指紋か顔で保護したり、スキャンした書類をすべて自動でGoogleドライブに同期することもできる。
アプリは現在Android版が公開されている。ダウンロードは無料でアプリ内購入もない。iOSなど他のプラットフォームにもStackを展開するかどうかは、ユーザーのフィードバックで決める予定だ。
カテゴリー:人工知能・AI
タグ:Google、Area 120、スキャン
画像クレジット:Google
[原文へ]
(文:Sarah Perez、翻訳:Kaori Koyama)