新型コロナによる非接触需要でスキャン技術のScanditが約86億円調達

企業向けバーコードスキャナーのScandit(スキャンディット)が8000万ドル(約86億円)のシリーズCラウンドをクローズした。本ラウンドはシリコンバレーのVCファームG2VPがリードし、Atomico、GV、Kreos、NGP Capital、Salesforce Ventures、Swisscom Venturesも参加。Scanditの累計調達額は1億2300万ドル(約132億円)となった。

チューリッヒに拠点を置くScanditはバーコードスキャン、OCR(光学文字認識)、オブジェクト検出、拡張現実(AR)にコンピュータービジョンと機械学習技術を組み合わせたプラットフォームを提供している。ARはスマホからドローン、ウェアラブル(倉庫労働者向けのARメガネなど)、ロボットに至るまでカメラ搭載のあらゆるスマートデバイス向けにデザインされている。

Scanditのプラットフォームのユースケースには、モバイルショッピング、セルフチェックアウト、在庫管理、配達証明、アセット管理・メンテナンスのためのモバイルアプリやウェブサイトがある。医療分野でも患者のIDや検体、薬、用品のスキャンに同社の技術が活用されている。

スピードや精度において、また明るさが十分でないところやあらゆる角度、破損したラベルのスキャン能力においても、自社ソフトウェアは「並ぶものがない」と同社はうたう。売り込みをかけている産業は小売、ヘルスケア、産業・製造、旅行、運輸・ロジスティックなどだ。

今回の資金調達の前には、2018年にシリーズBで3000万ドル(約32億円)を調達した。それ以来、経常収益は3倍超、優良顧客の数は倍以上となり、グローバルチームの規模も倍に増強した。

世界に広がる同社の顧客には7-Elevenアラスカ航空、Carrefour、DPD、FedEx、Instacart、ジョンズ・ホプキンズ病院、La Poste、Levi Strauss & Co、マウントサイナイ病院、トヨタなどが含まれる。現状では1億台超のデバイスで年間「数百億ものスキャン」が行われているとのことだ。

新たに調達した資金はアジア太平洋地域や中南米を含む新たなマーケットでのさらなる成長の加速、北米と欧州での足掛かり構築に使われる、とScanditは話す。また、企業がコンピュータービジョンとARを使って主力事業のプロセスを変える新しい方法を考案するためのR&Dにもこれまで以上に資金を注入する。

Scanditによると、新型コロナウイルス(COVID-19)パンデミックによるソーシャルディスタンシングの必要性から、個人のスマート端末向けのモバイルコンピュータービジョンの需要も増えている。非接触型のやり取りができるようにする方法を顧客が探している、と同社は話す。

また、パンデミック絡みでは他にも急増している需要がある。「クリック&コレクト」小売と、新たに発生している何百万もの宅配だ。専用のハードウェアではなく、ScanditのスキャンアプリはBYOD(bring your own device、個人のデバイスの持ち込み)をサポートするので、同社の技術はこうした需要にうまく対応できる。

「COVID-19は、この不確実な時代における急速なデジタルトランスフォーメーションの必要性、フィジカルとデジタルをブレンドさせて重要な役割を果たすことの必要性に光を当てた」とCEOのSamuel Mueller (サミュエル・モラー)氏は声明文で述べている。「新たな状態(ニューノーマル)がどのようなものであれ、さらに多くの企業が『コンタクトレス事業』の新たな需要にすばやく対応し、成功できるよう、新たな資金でサポートすることができる」。

資金調達に関する発表文の中で、ラウンドをリードしたG2VPのゼネラルパートナーであるBen Kortlang(ベン・コルトラン)氏は以下のように述べている。「Scanditのプラットフォームは、企業グレードのスキャンソリューションを従業員や顧客が古いハードウェアを必要とすることなくいつでも使えるようにしている。物理的世界とデジタルの世界を結ぶものであり、世界がオンライン購入や配達、分散サプライチェーン、キャッシュレス小売へのシフトを加速させる中で重要性が増すだろう」。

新型コロナウイルス 関連アップデート

[原文へ]

(翻訳:Mizoguchi

米国議会図書館が機械学習で300年ぶんの新聞の画像を抽出し検索可能に

昔の事件や人々に関する記録に関心のある歴史家たちは、かつては古い新聞の目録カードをかき分けていたが、次にマイクロフィルムをスキャンするようになり、やがてデジタルリストを検索するようになった。だが現代の技術は、個々の単語や写真に至るまで索引化を可能にした。米国議会図書館では、最新鋭の機械学習を使って1何世紀も前からの新聞記事の写真やイラストをデジタル化し分類する取り組みを進めている。

同図書館の「招聘イノベーター」の座を獲得したワシントン大学研究員であるBen Lee(ベン・リー)氏が主導するプロジェクトNewspaper Navigator(ニューズペーパー・ナビゲーター)では、アメリカの歴史に残る1600万ページぶんを超える新聞の画像を収集しデータを抽出している。

リー氏とその仲間は、昔の新聞や印刷物のデジタル化で先行しているChronicling America(クロニクリング・アメリカ)の仕事に刺激を受けた。Chronicling Americaは新聞のあらゆる内容を光学文字認識(OCR)でスキャンしているが、これはクラウドソース・プロジェクトでもあるため、さらなる分析のための画像の特定や切り出しは人の手が必要だ。ボランティアの作業員は、第一次世界大戦に関係する画像を枠で囲んで説明文を書き写し、画像を分類している。

この限定的な取り組みを見て、リー氏のチームは考えた。「印刷物の画像の特性を生かすものとして、私はそれが大好きでした。そのプロジェクトから生まれた内容の視覚的多様性を見て、純粋に素晴らしいと感じ、米国中の新聞記事を対象にこのような内容を記録できたらどうだろうかと考えたのです」とリー氏はTechCrunchに語った。

彼はまた、ボランティアが作り出したものが、実は機械学習システムのトレーニング用データとして最適であることに気がついた。「これを使ってオブジェクト検出モデルを構築し、あらゆる新聞紙面を読み込ませれば、宝の箱を開けることはできないかと私は自問しました」。

うれしいことに、答えはイエスだった。最初の人力による画像と説明文の切り出し作業を利用し,彼らは、それを自力で行えるAIエージェントを構築した。普通に微調整や最適化のあと、彼らはChronicling Americaがスキャンした新聞記事の完全なデータベースの中にそれを解き放った。

上段左から、画像をダウンロードしてMETS/ALTOでOCR、視覚コンテンツ認識を実行、視覚コンテンツの切り出しと保存、画像埋め込みの生成。下段左から、OCR、予測された境界ボックスからOCRを抽出、抽出されたメタデータをJSON形式で保存

「19日間ノンストップで稼働しました。私が経験した中で最大のジョブです」とリー氏。しかし、結果は驚くべきものだった。3世紀(1789年から1963年)にわたる無数の画像が、それらに本来付属していた説明文から抽出されたメタデータとともに分類されたのだ。この処理が解説されている研究論文は、ここで読める。

説明文が正しいと仮定すると、これらの画像(つい最近までアーカイブを日付ごとに追いかけ、文章をひとつひとつ読んで、片っ端から調べなければ見ることができなかったもの)は、他の言語資料と同じように内容で検索できるようになる。

1870年の米国大統領の写真を探したいなら、もう狙いをつけて何十ページもの新聞を読みあさり写真の説明文の内容を何度も確かめる必要はなく、Newspaper Navigatorで「president 1870」と検索すれば済む。または、第二次世界大戦時代の風刺漫画を見たいなら、日付の範囲を指定するだけで、すべてのイラストが入手できる(彼らはすでに写真を年別のパッケージにまとめていて、その他のコレクションもそうする予定だ)。

下にいくつかの新聞紙面の例を示す。機械学習システムが切り出した枠が重ねられている(注意:帽子の広告が山ほどあり、差別的な内容も含まれる)。

  1. newsnav-examples-4

  2. newsnav-examples-3

  3. newsnav-examples-2

  4. newsnav-examples-1

  5. newsnav-examples-5

少しの間、気楽に眺めるのも楽しいが、重要なのは、これが研究者たち(そしてその他の資料一式)に何をもたらすかだ。研究チームは本日、このデータセットとツールの公開を記念して、データの利用法のアイデアを競うイベントを開催する予定だ。新しい使い道の発見と実用化の方法が得られればと彼らは期待している。

「このデータセットの創造的な利用法をみんなで考える、素晴らしい催しになればと考えています」とリー氏。「機械学習という観点から私が心底ときめいたのは、人々が独自のデータセットを作れるユーザーインターフェイスを構築するというアイデアです。風刺漫画やファッション広告など、自分の興味に応じてユーザー自身が定義し、それに基づいて分類器のトレーニングができるインターフェイスです」。

南北戦争時代の地図を要求したことを想定した検出例。

視点を変えれば、Newspaper NavigatorのAIエージェントは、その他のコレクションのスキャンやデジタル化に使える、より具体的な内容のエージェントの親になることができる。これは実際、米国議会図書館で計画されていることだ。デジタルコレクションの担当チームはNewspaper Navigatorがもたらした可能性と機械学習全般を、おおいに歓迎している。

「私たちが興味を抱いていることのひとつに、私たちが使える検索や発見の手段をコンピューターが拡大してくれる可能性があります」と米国議会図書館デジタル戦略ディレクターのKate Zwaard(ケイト・ツワード)氏は語る。OCRのおかげで、それなしに探せば何週間も何カ月もかかったであろうものが見つけられるようになりました。図書館の蔵書には、美しい図版やイラストが掲載されたものが数多くあります。しかし、たとえば聖母子像にはどんなものがあったかを知りたいとき、一部は分類されていますが、その他のものは本の中にあって分類されていません」。

その問題は、画像と説明文を結びつけるAIが体系的に本を熟読することで、早々に解決できる。

Newspaper Navigatorを構成するコード、画像、そしてそれが生み出した結果のすべては、完全なパブリックドメインとして、目的にかかわらず無料で利用でき、改変もできる。コードは同プロジェクトのGitHubで入手可能だ。

画像クレジット:Library of Congress

[原文へ]

OCR技術を提供するオーストリアのAnylineが約13億円を調達し米国進出

オーストリアのウィーンを拠点とし、ウェブサイトやアプリにOCR機能を組み込む開発者向け技術を提供するAnylineが、シリーズAで1200万ドル(約13億2000万円)を調達した。同社は米国進出の計画も明らかにした。

このラウンドを主導したのはベルリンを拠点とするVCファームのProject Aで、これまでもAnyline投資してきたJohann ‘Hansi’ Hansmann(ヨハン・ハンシ・ハンスマン)氏、Senovo、Gernot Langes-Swarovski Foundationも参加した。

Anylineは2013年に設立された。同社によれば大手のテクノロジーベンダーがまだ提供していない専門的なOCRソリューションを提供しているという。それにより同社はキヤノン、ポルシェ、ドイツ電力大手のE.ON、各国政府や国連といった国際的なクライアントを抱えている。

AnylineのOCR機能は最新のウェブサイトやアプリに組み込むことが可能だ。企業はこの機能を使って、一般的なモバイルデバイスで身分証明書、シリアル番号、公共料金のメーターといったさまざまな「アナログ」情報をスキャンし、収集できるようになる。

こうしたアプローチの利点は言うまでもない。実用的なOCR技術の活用で、企業はミスが発生しがちなデータの手入力をなくし、時間とリソースを大幅に節約できる。

顧客側も、OCRでデビットカードをアプリに追加したり検針結果を送信できれば、何桁もある数字をスマートフォンで手入力するよりずっと楽だ。

Anylineは、新たな資金は主に従業員数を2倍にし、2020年前半に初の米国本社をボストンに開設するために使う予定だという。これにより、モバイルOCRソリューションを海外の新たなマーケットやスマートマニュファクチャリング、本人確認サービス、フィンテックといった新しい業界に広げていくことができると同社はいう。

AnylineのCEOで共同創業者のLukas Kinigadner(ルーカス・キニガードナー)氏は発表の中で次のように述べている。「企業がますますバーチャルの世界に移行していく中で、これまではアナログだったメディアをデジタル化する高度なテクノロジーの利用は不可欠だ。世界中の企業で、手入力によるエラーと非効率な作業とフラストレーションをなくすためにヨーロッパ生まれのテクノロジーが力になっていることを、我々は誇りに思う。AnylineはモバイルOCRのマーケットリーダーとして、こうした課題に取り組むべき企業のテクノロジーパートナーになるつもりだ」。

米国進出に関しては、同社はAnyline Inc.を設立し、Cognex Corporationのグローバルセールス責任者だったBryan Boatner(ブライアン・ボートナー)氏をセールスおよび事業開発担当バイスプレジデントとして迎えた。

[原文へ]

(翻訳:Kaori Koyama)

OCR、自然言語処理、データ予測などAIプロダクトを複数提供するCogent Labsが資金調達

手書き文字をデータ化するOCRプロダクトの「Tegaki」などを提供するCogent Labsは1月30日、SBIインベストメント、京都電子計算、TIS、野村ホールディングス、みずほ銀行、三井住友信託銀行、および個人投資家から資金調達を実施したと発表した。金額は非公開。

Cogent Labsが手がけるサービスは3つある。金融機関や自治体向けに導入が進む手書き文字の読み取りサービス「Tegaki」、ニュース分析などに利用する自然言語文章の分析エンジン「Kaidoku」、金融業界などで利用できる時系列データ予測エンジンの「TSF」などを展開している。

このようにAI関連技術を応用して複数のプロダクトをCogent Labsは国内外から優れたAI人材を採用し、技術の研究開発にも積極的だ。世界20カ国からAI人材を採用し、従業員は現在66名となっている。また、2018年10月にはイギリスのUniversity College Londonとのパートナーシップを発表。人間の脳と同じ仕組みでAIが思考する「モジュラーAI」という次世代AI技術を共同で研究していくという。

同社は今回調達した資金を利用して、既存サービスの強化、および上記のようなAI技術を応用した新規サービスの開発を進めるという。

紙の帳票のデジタル化に今でも使われているOCRをやや賢くするAmazon Textract

ほとんどの企業が困ってることのひとつが、各種の伝票をはじめ、いろんな書式(フォーム, form)をデジタル情報に変えて、保存したりソフトウェアで処理したりすることだ。よくあるやり方は、人間の事務職員がコンピューターにデータ入力すること。最新技術を使う方法としては、OCRに書式を自動的に読ませるやり方がある。

しかしAWSのCEO Andy Jassyに言わせると、OCRは要するに無能な読み取り機にすぎない。それはテキストのタイプなどを認識しない。それを変えたいAmazonは今日(米国時間11/28)、Amazon Textractという、ややお利口なOCRツールを発表した。これなら書式上のデータを、もっと使いやすい形でデジタル化してくれそうだ。

Jassyが例として見せたのは、表のある書式だ。通常のOCRは表を認識しないから、表の各欄の枠を超えて、ひとつのテキストとして読み出す。Textractは、表などの、よく使われる成分を認識して、妥当な形でデータを取り出す。

Jassyによると、書式はよく形が変わるので、OCRの無能を補うためにテンプレートを使っていても、形が変わるとテンプレートは役に立たない。一方Textractは、よく使われるデータタイプ、たとえば社会保障番号、誕生日、住所などなどを知っているので、それらがどんな形で収まっていても正しく解釈できる。

“Textractには、この形の文字集合なら誕生日、これなら社会保障番号、等々と教えてあるので、書式が変わってもそれらを見逃さない”、とJassyは説明した。

more AWS re:Invent 2018 coverage

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

Dropboxにユーザーのすべての画像とPDFを自動的にOCRする機能が登場

Enterprise Dropboxに、一部のユーザーが待ち焦がれていたと思われる便利な機能がやってきた。それは画像やPDFファイル中の文字を自動的にテキストデータへ書き起こす光学式文字認識(optical character recognition/reader, OCR)機能だ。これからは、セーブした写真をかき回してレシートを探さなくてもよいし、目的の情報を探してたくさんのファイルを開かなくてもよい。単純に、テキストで検索できるのだ。

Dropboxのテキスト認識エンジンは今後数か月で、DropboxのPro, Business Advanced, そしてEnterpriseアカウントに実装されるが、アーリーアクセスがあるかもしれないから、ときどきチェックしてみよう。

このOCR機能は、ユーザーのすべての画像やPDFをスキャンしてテキストを取り出し、それらをメタデータに加えるので、ユーザーはそれを検索できる。もちろんそのデータは、正規のドキュメントとして安全に保存される。便利だが、問題は書き起こしの精度だ。OCRはときどき、気難しいからね。

Dropboxに永久につきまとう、もっと簡潔な名前のコンペティターBoxは昨年、多機能なOCRを導入した。多機能というのは、文字だけでなくオブジェクト(物)も認識するからだ。これに比べてDropboxのは、機能的にやや劣るかもしれないが、でも日常のOCRニーズには十分だろう。

これまで、指定したドキュメントをOCRすることはできたが、もちろんこっちの方が便利だ。Dropboxの技術情報のブログには、この自動化OCR機能の開発史が語られている。Boxは、GoogleのOCR機能を下敷きにしたらしい。〔訳注: Google Drive -> Google DocsにもOCRがある(全自動ではない)。〕

Dropbox Enterpriseのようなグループアカウントのメンバーは、全員がこの機能を利用でき、しかもこの機能が有効になったときは自動的に、既存のドキュメントもすべてOCRされる。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

手書き文字認識率99.91%のAI-OCRで紙業務を効率化するAI insideが5.3億円を調達

AIを活用したOCRツールによって書類のデータ化の効率をあげるAI inside。同社は8月3日、東京大学エッジキャピタル、日本郵政キャピタル、三菱UFJキャピタルを引受先とした第三者割当増資により総額約5.3億円を調達したことを明らかにした。

今回調達した資金を基に組織体制を強化し、コアとなるテクノロジーの研究開発を進めるほか、OCRサービス以外のAIを活用したプロダクトも含め事業拡大を目指していくという。

金融法人など約120社が使うAI OCRサービス

AI insideは設立当初から文字認識のAIの開発に着手し、手書き帳票のAI OCRサービスを展開してきた。2017年リリースの「DX Suite」では、高精度かつセキュアに書類のデータ化を遂行する3つのアプリケーションを提供。これによって企業がこれまで手作業で行なっていた紙業務の大幅な効率化を支援している。

7月末時点で銀行や保険会社などの金融法人を中心に、大日本印刷やパソナ、レオパレス21など121社がアクティブユーザーとしてDX Suiteを活用。AI inside代表取締役社長CEOの渡久地択氏の話では、この半年ほどでユーザー企業数が約6倍に増えたそうだ。

利用シーンの一例をあげると金融機関での住宅ローンや口座振替依頼書のほか、注文書を含む申込書系の書類のデータ化など。従来3人でやっていた業務にDX Suiteを取り入れることで2人体制でカバーできるようになった、といったものが典型的な効果だが、一部導入企業では受発注業務を完全にオートメーションしている例もある。

渡久地氏によるとDX Suiteの特徴は軸となる文字認識AIの精度と、実際に業務に組み込む際の使い勝手の良さにあるという。

同社の文字認識AIでは漢字第一、第二水準にひらがな、カタカナを加えた約6300文字を平均99.91%の認識率で読み取る。この認識率の高さを支えているのが、同社が研究開発を進めてきた「推論アルゴリズム」「学習アルゴリズム」「データ生成アルゴリズム」という3つのアルゴリズムだ。

推論アルゴリズムにおいては通常の文字認識技術と言われるようなゾーンだけでなく、一般物体認識や音声認識で使われるアルゴリズムを応用。たとえば「自動運転でどこに人がいるのかを見分ける技術」を用いて「帳票のどこに文字が書いているか」を認識したり、長文を読み取る際に音声認識のアルゴリズムを活用したりしているのだという。

渡久地氏がポイントにあげるのが「教師データ自体をAIが作り出すデータ生成アルゴリズム」だ。普通にやっていては手書きの学習データを集めるのが大変だが、AI insideでは手書き風の画像をAIが生成する仕組みを構築。これによって膨大な教師データを用意することができ、高い文字認識率の実現にも繋がった。

これらの技術によって単に手書き文字を読めるというだけでなく、本来は読み取る必要がない文字や点線を対象外にするなど、ちょっとした機転が利くのもDX Suiteのウリだ。

業務フローに取り入れやすい仕組みを構築

また渡久地氏が「業務フローに取り入れることができなければ、実際に使ってもらえない」と話すように、DX Suiteでは認識率以外の点にもこだわっている。

OCRサービスでは誰でも使えるように、クリックだけでOCRの設定からワークフローの設定までが完結。読み取ったデータのチェックもボタンひとつでサクサク進む。

業務で使うことを考えると欠かせないセキュリティについても、すでに3つの技術特許を取得(同社では文字認識技術など現在6つの特許を取得済み)。大手金融機関が導入を検討する際にはここがひとつのポイントになるそうだ。

合わせて複数種類の帳票がある場合に、ごちゃ混ぜの状態でスキャンしても機械的に仕分けてくれるツールや、アクセス権限を管理できるツールも開発。これらを従量課金制で月額10万円から利用できるクラウド版、金融法人の導入が多いセキュリティ面に強みを持つハイブリッド版、オンプレミス版という複数の方式で提供している。

OCRツールを軸にAIで企業の課題解決を

AI insideは2015年8月の設立。代表の渡久地氏は過去にグルメサイトの売却経験や事業譲渡の経験を持つ起業家。AIにはかつてから関心を持っていたそうで、10年以上に渡って継続的に研究開発に取り組んできたという。

「生産年齢人口が今後減っていく中で、AIを活用することによって生産性を向上できる領域、特に社会に大きなインパクトをもたらす領域について検討した結果、文字認識という所に行き当たった。OCRツール自体はずっと前からあるものだが、精度や業務フローとの兼ね合いがネックになり、なかなか導入が進んでこなかった領域。規模問わず困っている企業も多く、効率化できれば嬉しい部分でもある」(渡久地氏)

AI insideにとってVCから本格的に資金調達をするのは今回が初めてとなるが、これまでもアクサ生命保険や第一生命保険、大日本印刷、レオパレス21などと資本業務提携を締結。大日本印刷とはBPO分野へのAIの導入、レオパレス21とはAI活用の賃料査定システムの開発など、OCRツールを皮切りにその他の分野でもAIを用いた取り組みを強化してきた。

今後も当面はDX Suiteを事業の軸に据え、非定型の書類への対応(現在一部のみ対応している)などさらなる機能改善を進める方針。事業の横展開についても「あまり脇道にはそれず、OCRに対してフィードバックが得られるような分野や、OCRによって取得したデータの活用がスムーズにいくような分野などが中心になる」(渡久地氏)という。

ABBYYのOCRソフトTextGrabberが翻訳機能つきでiOSに登場、海外旅行で便利

ABBYY日本)は大昔からOCR(optical character recognition, 光学式文字認識)ソフトを作っているが、今回そのソフトウェアをモバイルに持ち込んだ。画像中のテキストをリンクのようにアクション化したいときには、とても便利に使える。

それは、ABBYYのiOSアプリTextGrabber 6.0で、AppleのAppStoreにある。文字認識機能はリアルタイムで、インタフェイスのデザインもすっかり変わった。

テキストは、どんな背景のどんな色の文字でもよい。また写真の中でも、目の前の実画面でもよい。文字認識はリアルタイムでデバイス上で行われ、インターネットへの接続は要らない。61の言語を認識するが、それは類似製品中で最多だ。また得られたテキストは、コピー、編集、共有等ができ、有料拡張機能により104の言語に翻訳でき、VoiceOverに音読させることもできる。

そのテキストがリンクや電話番号、メールアドレス、番地、イベントの詳細などだったら、クリックしてアクションに結び付けられる(たとえばメールが開く)。QRコードも読む。

旅先で案内板などを見たときには、このアプリをとくに便利と感じるだろう。レストランのメニューなどでも、あなたの自国の言葉にすぐに翻訳してくれる。

それらの新しい機能は、ABBYY独自のReal-Time Recognition SDKで実装されている。写真をユーザーのデバイスに保存したりしないから、セキュリティの面でも安心だ。

TextGrabber for iOSは6月29日まではAppStoreで無料、それ以降は4ドル99セントだ。翻訳機能は、アプリ内購入で3ドル99セントだ。〔Android用はここ。〕

〔参考(類似アプリ): iOSAndroid。〕

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

Adobe Scanは文書やレシートその他を編集可能なPDFに変換する

本日(米国時間6月1日)Adobeは、紙文書などを編集可能なPDFファイルへと簡単にデジタル変換できる、新しいモバイルアプリAdobeScanを発表した。App Storeには、既に多くのスキャンしてPDFへ変換するアプリが溢れているが、その多くは無料ではなく、デザインは古臭く、あるいは単にイメージをPDFに変換するだけで編集可能にはしてくれないものが多い。一方、Adobe Scanは、光学式文字認識(OCR)を使用して、印刷されたテキストをデジタルテキストに変換し、Acrobat Reader DCまたはAcrobat DCを使って検索、選択、コピーあるいは注釈付けができるようにする。

これに加えて、Adobeは無料アプリでもスキャンできるページ数に限界はなく、スキャンクオリティも下げないと言っている。

もちろんMicrosoft(Office Lens)、Google(Googleドライブ)、あるいはScanner Proなどの一般的なサードパーティ製アプリケーションなどを利用することに比べて、利用者の視点から見て優れている、あるいは困る点は、このアプリがAdobeのDocument Cloudと連携するようにデザインされているということだ。Adobeの顧客たちにとってはこれは利点だが、好みのアップロード先を選択できるようにする、より自由なソリューションを好む者もいる。

モバイルでスキャンしたドキュメントは、Adobe Document Cloudアカウントに自動的にアップロードされ、オンラインで保存したり、他のユーザーと共有したりすることができる。そしてもしAcrobat DCの加入者(スタンダードは月12.99ドル、プロは月14.99ドル)なら、文書の完全な編集と整理、そして署名の入力なども可能になる。

Adobe Scanは、単に紙だけを対象としたものではないことも指摘しておこう。同社によれば、ショッピングのレシート、名刺、会議中に表示されたスライド、さらにはホワイトボードのようなものをスキャンすることもできるという。

この新しいアプリは、Adobe Senseiという名のAIおよびマシンラーニングに基づくプラットフォームによって支えられている。 Senseiは、境界検出、自動トリミングとキャプチャ、パースペクティブ補正、例えば影部分を削除する自動クリーンなどの実現に利用される。

また、Adobe Signの新しいモバイル機能と連携して、どのデバイスからでもドキュメントに自動的に署名して送信することができる、とAdobeは発表している。

新しいアプリは、今日(米国時間6月1日)からiOSAndroidの両デバイスで利用可能だ。

[ 原文へ ]
(翻訳:Sako)

カメラで文字を撮る旅行向け翻訳アプリ、Waygoが日本語もサポート開始

Waygoは中国語のテキストの上にスマートフォンをかざすと英語に翻訳してくれるアプリだが、このほど日本語の翻訳のサポートを開始した。Waygoは最近SXSW2014 アクセラレータ・プログラムに選定された。また500 Startupsの卒業生でもある。

Waygoアプリはスマートフォン(現在はiPhone)がインタネットに接続していなくても独自のOCRテクノロジーによってフレーズや個別の文字の翻訳が可能だ。Pleco中国語辞書などOCRを内蔵したアプリは他にもあるが、Waygoは旅行者向けに特化し、また複数言語をサポートすることで差別化を図っている。

アプリの操作は非常に簡単だ。画面から横書あるいは縦書のテキストを選択して撮影する(フラッシュを点灯するほうが認識精度が高まる)。これはフリーミアム・モデルで、各言語について1日10回までの利用は無料だ。それ以上の回数が必要な場合、1週間について1.99ドル〔200円〕と期間無制限の6.99〔700円〕のプランがある。これはライバルに比べて割安な料金だ。

CEO、共同ファウンダーのRyan Rogowskiは「最初に追加する言語に日本語を選んだのはユーザーからの要望が一番多かったからだ。特にビジネスで出張者の要望が多かった。他の地域に比べて日本では英語の表示が少ない。公共交通機関でさえ英語表示がない場合が多い」と語った。

私はWaygoの日本語機能をレストランのメニューで試してみたが、 料理名がちゃんと翻訳された。しかしWaygoのOCRは白地に黒あるいは濃色のフォント以外では認識精度が落ちるようだ。また標準的でないフォントや手書き文字では認識に失敗することが多かった。内蔵辞書はメニューや標識、公共表示に重点を措いているので複雑な文章を翻訳するのは苦手だ。現在のところ語学の勉強に使うアプリではない。しかし旅行者向けには大いに役立つだろう。

Rogowskiは「次にどの言語をサポートするかまだ決めていないが、おそらくアジアの言語になるだろう」と述べた。

写真:Ryan Rogowski

[原文へ]

(翻訳:滑川海彦 Facebook Google+


シンガポールのEchelonカンファレンスでOCR翻訳のWaygoが最有望賞–本誌ミートアップもあり

シンガポールで行われた2013Echelonカンファレンスで、Waygoが「もっとも将来性のあるスタートアップ」賞を取った。

7名の審査員の中には、500 Startupsの創立パートナーDave McClure、SingTel Innov8のCEO Edgar Hardless、Southern Cross Venture PartnersのマネージングディレクターJohn Scullらがいた。

WaygoはOCRで読んだ文を翻訳するが、今は中国語→英語だけだ。オフライン、リアルタイムで使え、英語が中国語のテキストの上にオーバレイされる。

同社は、500 Startupsの2月の育成事業の卒業者だ。

受賞直後に協同ファウンダのHuan-Wu Yuに話を聞いたが、社歴2年の同社は近く、75万ドルのシードラウンドを完了するそうだ。

Waygoのユーザは今およそ4万で、Lonely PlanetやAmerican Airlinesとプロモーション契約の交渉を進めている。そして今は、日本語バージョンと韓国語バージョンを開発中だ。

今日(米国時間6/4)、EchelonカンファレンスのあとでTechCrunch meetupがある。Josh Constineと私が出席する。時間は今日の午後6時から8時までで、場所はMOA New Zealand Bar, 5 Changi Business Park Central 1, Singapore Cityだ。

そこで、お会いしましょう!


[原文へ]
(翻訳:iwatani(a.k.a. hiwa))