レシートを人間が読み取るクラウド家計簿「Dr.Wallet」がローンチ

個人資産管理や家計簿機能を提供するサービスが国内外で増えている。米国では約1200万人が利用するMint.comをはじめ、YodleePersonal Capitalなどがある。401Kに特化したものや企業の福利厚生の一環で提供するサービスなど目的特化型もあるなど多様化も進んでいる。

一方、日本ではまだMint.comのような圧倒的なシェアを持つサービスは登場していない。MoneyFowardOCN家計簿、MoneyLookMoneyLookZaimMoneytreeなどがあるが、MoneyLookをのぞいてサービスローンチは、ここ1、2年のこと。日本のテック業界が米国のトレンドを2、3年遅れて追いかけているというだけでなく、個人資産運用という意識が日本人に希薄ということもあるのかもしれない。

ともあれ、日本では家計簿サービスがちょっと盛り上がりそうな雰囲気だ。デスクトップ向けの家計簿アプリはずっと昔からあったわけだが、ここに来てスマフォによる「その場での入力」やレシート撮影、クラウドでの管理が可能になったことを背景に新世代のサービスが登場しているからだ。

このジャンルで注目されているのはZaimだ。2012年11月にクックパッドから4200万円の資金を調達したことや開発者がギークな女子であること、当初からモバイルアプリを提供していることなどから話題となっている。

精度99.98%、最も入力が簡単な家計簿

クラウド家計簿というべきジャンルで今日また1つ、クローズドβを経て新サービスがローンチした。撮影したレシートの「人力入力」を特徴とする「Dr.Wallet」(ドクターウォレット)だ(Android版アプリ)。飲食店や小売店で受け取ったレシートを、その場でスマフォで撮影してクラウドに送ることで、その先は人間が読み取ってデータを入力してくれる。人間によるデータ化というのは名刺管理サービスのEightに似た発想だ。「最も入力が簡単な家計簿」をうたい、精度を99.98%としている。

現在、Zaimをはじめとする多くのOCRを利用したレシートの自動入力アプリはアイエスピーの提供するレシート解析エンジンを利用している。日付、合計金額、購入品目などを撮影画像から自動認識する。全項目平均認識率は96%だという。項目平均ということは、全部で4項目あるレシートで一発で正しく全てを認識する率は85%程度(0.96^4)ということだろう。私は家計簿をつけたことがないが、今回しばらくZaimを使ってみて分かったのは、多くのレシートで金額こそ結構正しく認識するものの、歩きながら撮影するなど条件の悪い撮影データの場合には認識がうまくいかずに手作業による修正が少なからず発生するということだ。丸まりがちなレシートを指で伸ばしても幾何学歪みはある。文字が傾いたり光量が足りないデータでは認識率が落ちる。「それは単に撮影の仕方が悪いだけ」という声も聞こえてきそうだが、完璧なセッティングで撮影がしたんじゃなくて、私だって手軽にレシートを入力したいだけなのだから仕方がない。タクシー代と飲食代だけ把握したいというライトユーザーの私にはZaimの認識率で不満というほどではないのだが。

ともあれ、OCRの自動認識による、こうした「二度手間感」を解決しようというのがドクターウォレットだ。

ドクターウォレットを開発・運用するBearTail創業者の黒崎賢一氏によれば、OCR方式では「撮影(10秒)→認識(5秒)→認識データ確認&修正(20秒)→保存(5秒)」で合計約40秒かかるところ、人力だと「撮影(5秒)→画像確認&送信(5秒)」と合計約10秒と入力の時間(手間)が軽減されるという。撮影時間が短く見積もっているのは、撮影時にガイドラインに細かく合わせなくても良いからだそうだ。時間の短縮というより、手間の軽減による利用継続性に差が出そうだ。ドクターウォレットで入力の手間がほぼゼロになることで、「家計簿とはコツコツつけること」という一般の認識を変えることができれば、そもそも家計簿をつけてこなかった層にアピールする可能性はあるのかもしれない。たとえレシートを溜め込んでしまってからでも、「撮影だけでOK」であれば、使う可能性もある。

ドクターウォレットの場合、赤の他人が見てデータを入力するわけだから、そのこと自体を大きなデメリットと感じる人もいるだろう。また、スマフォ上で認識が完結するOCR方式と異なり、サーバへのデータ送信が発生することや、入力作業が終わるまでにタイムラグがあることなどがデメリットかもしれない。

ドクターウォレットで実際にデータ入力作業を担当するのは日本人だ。黒崎氏によれば「ニアショアのような形で、地方の方と連携しています。スタート時点の専属のオペレーターは20名ほどです。スケールはオペレーターの数を増やすこと、OCRを前処理としてかませることで、入力個数を減らし、レシートデータ化単価を下げて行きます」ということだ。また、「データ化を行うスタッフは、そのレシートを送信されたお客様のお客様情報から隔離されています。また、レシート画像についても秘密保持義務を負っています。お客様のレシート1枚1枚が、可能な限り別のスタッフによってデータ化されます」としている。

データ化の単価などは非公開だが、今後下げていく余地があるという。「オペレーションが固まり次第、効率化出来る部分に対して、エンジニアリングの力を使ってコストを下げます。その際に、OCRで電話番号と数字だけは認識することなどを検討、研究しています」。画像処理や機械学習なども組み合わせていく、という。黒崎氏は筑波大学情報学部を休学中の21歳で、BearTail社のメンバーには、筑波大学の情報系の学生が多い。同社にはまた、インキュベイトファンド代表パートナーの本間真彦氏が取締役として名を連ねている。

マネタイズについては、データ化優先権、経費申請用のCSVエクスポートなどを有料化する可能性があるほか、クーポン提案を行う法人への課金などを検討しているという。


投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。