紙の帳票のデジタル化に今でも使われているOCRをやや賢くするAmazon Textract

ほとんどの企業が困ってることのひとつが、各種の伝票をはじめ、いろんな書式(フォーム, form)をデジタル情報に変えて、保存したりソフトウェアで処理したりすることだ。よくあるやり方は、人間の事務職員がコンピューターにデータ入力すること。最新技術を使う方法としては、OCRに書式を自動的に読ませるやり方がある。

しかしAWSのCEO Andy Jassyに言わせると、OCRは要するに無能な読み取り機にすぎない。それはテキストのタイプなどを認識しない。それを変えたいAmazonは今日(米国時間11/28)、Amazon Textractという、ややお利口なOCRツールを発表した。これなら書式上のデータを、もっと使いやすい形でデジタル化してくれそうだ。

Jassyが例として見せたのは、表のある書式だ。通常のOCRは表を認識しないから、表の各欄の枠を超えて、ひとつのテキストとして読み出す。Textractは、表などの、よく使われる成分を認識して、妥当な形でデータを取り出す。

Jassyによると、書式はよく形が変わるので、OCRの無能を補うためにテンプレートを使っていても、形が変わるとテンプレートは役に立たない。一方Textractは、よく使われるデータタイプ、たとえば社会保障番号、誕生日、住所などなどを知っているので、それらがどんな形で収まっていても正しく解釈できる。

“Textractには、この形の文字集合なら誕生日、これなら社会保障番号、等々と教えてあるので、書式が変わってもそれらを見逃さない”、とJassyは説明した。

more AWS re:Invent 2018 coverage

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

テクノロジーの利用による効率化が遅れている大企業の財務や法務にコラボレーションを持ち込むClauseMatch

ClauseMatchのCEO Evgeny Likhodedは、契約交渉というものがどんなものだったか、よくおぼえている。彼がMorgan StanleyやGazpromにいたときは、各種金融製品や商品取引をめぐって契約や合意を交渉するチームに配属されていた。

エンタープライズの多くの部分でテクノロジーが進化したが、Likhodedによると、財務や法務、保険関連などコンプライアンスが厳しい部門では、圧倒的にMicrosoft Wordに依存して文書の作成や編集を行い、それらの変更や承認を行う部署への配布には、圧倒的にメールが使われていた。

“大企業の、とくに法務の連中の仕事は、そこに何らかの文書が絡んでくるといつでも、何人かの利害関係者たちが意見を述べ、変更を加え、その文書を承認していた。文書を10か20の部署に送ると、それぞれ異なる10通が返ってきて、それらをすべて原本に取り入れなければならない”、とLikhodedは往時を語る。

関連部署が増えるとさらに複雑になる。80から100名ぐらいからの入力や承認が必要になると、Likhodedによれば、人びとは原始的な変更追跡とバージョンコントロールのフォームとしてスプレッドシートを作った。そして多くの場合、監督部門は文書の作成過程を理解するために監査証跡〔完全詳細な変更・編集履歴〕を見たがるので、問題はさらにややこしくなった。

これらすべてを踏まえてLikhodedは、ClauseMatchの構築に取り組んだ。財務や法務関連のチームがリアルタイムでコラボレーションしながら文書を作成編集し、変更を記録追跡し、承認のシルシを付け、そしてサインをもらうソフトウェアだ。

単純にすべてのアップデートをインデクシングして、すべての文書に完全な監査証跡が備わるようにする。文書がどう変化・進化してきたかよく分かり、誰がいつどこをどう変えたかも分かるから、機密情報も管理しやすい。

2016年の初めにソフトローンチしたClauseMatchは、バークレーズ(Barclays)に採用されて、同社のポリシー管理の合理化に貢献している。概念実証の段階で採用した数社は、近く完全なデプロイメントへ移行する予定だ。

その結果ClauseMatchは、Speedinvestがリードするラウンドで160万ドルのシード資金を獲得でき、それには既存の投資家SparkLabs Global VenturesとTechstars、元Thomson ReutersのCEO Tom Glocer、元SunGardのCEO Cristobal Condeらが参加した。

新たに資金を得たClauseMatchは、すでに成長しているチームをさらに大きくしたいと考えている。社員数は、1年前の6名から20名に増えた。今後はプロダクトチームを増員するとともに、営業とマーケティングを本格的に展開したい意向だ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))