コンピュータービジョンで多様なエフェクトを作れるビデオエディターVOCHIが全世界的に好評

オンラインのクリエイターたちが使用する、コンピュータービジョンの技術を利用した巧妙なビデオ編集アプリを作っているベラルーシのVOCHIが、昨年のウクライナのGenesis Investmentsがリードする150万ドルのラウンドに続き、このほど、「後期シード」と称するラウンドでさらに240万ドルを獲得した。新たな資金は、このモバイルツールのこれまでの大きな成長を踏まえており、今では毎月50万あまりのユーザーが使用し、1年で400万ドルあまりを稼いでいる。

この最新のラウンドの投資家は、TA VenturesとAngelsdeck、A.Partners、Startup Wise Guys、Kolos VC、そしてベラルーシのVervやエストニアのユニコーンBoltなどの企業からのエンジェルたちだ。資金調達と並行してVOCHIは、同社の最初の社員でマーケティングのトップだったAnna Buglakova氏を、プロダクト担当最高責任者(CPO)である共同創業者に昇進させた。

VOCHIの共同創業者でCEOのIlya Lesun氏によると、同社の発想はプロフェッショナルなビデオ編集技術を一般人が容易に使えるようにして、彼らの作るユニークでトレンディなコンテンツのおかげで、作者がソーシャルメディア上で目立つ人気者になることだった。そのためにVOCHIは、コンピュータービジョンの技術を利用した独自のビデオセグメンテーションアルゴリズムにより、映像中で動いている特定のオブジェクトや、写真などの静止画像中の特定部分に、さまざまなエフェクトをかける。

Lesun氏の説明によると、「そんな結果を得るために二つの訓練済みの畳み込みニューラルネットワークが、半教師ありのVideo Object SegmentationとInstance Segmentationを実行する。弊社のチームはさらに、ビデオエフェクトのためのカスタムのレンダリングエンジンを開発し、それは相手が4Kでもモバイルでも瞬時の適用ができる。しかも画質の損失がない」。編集作業としてのエフェクトの適用は、わずか数秒でできる速さだ。

関連記事: コンピュータビジョンを利用して動画の特定部分のみにエフェクトをかけられるスマホ向け編集アプリ「Vochi」

最初のシード資金はマーケティングと製品開発に投じられ、今や同社にはユニークなエフェクトが80以上、フィルターは30以上ある。


画像クレジット: VOCHI

今ではこのアプリは、ビデオに特殊な美観を与えるツールをいろいろ提供している。たとえば、夢の中のような雰囲気や、美術絵画の中、昔の8ビット画像などだ。また、動くオブジェクトはその輪郭を光らせたり、ぼかしや運動を加えたり、さまざまなフィルターを適用したり、またビデオ中に3Dオブジェクトを挿入し、ギラギラ感やチカチカ感を加えるなど、いろんなことができる。

また、コンテンツを直接編集するだけでなく、アプリ内でホームフィードを縦にスワイプすると、自分のコンテンツに他人が行った編集を見て、編集のヒントにすることができる。そして、好きだなと思うものを見たら、ボタンをタップするだけで同じエフェクトを自作に適用できる。完成したらそれをInstagramやSnapchat、TikTokなど、他のプラットホームで共有できる。

VOCHIはベラルーシの企業だが、ユーザーの大半は米国の若者だ。Lesun氏によると、ほかにロシアやサウジアラビア、ブラジル、そしてヨーロッパ各地のユーザーも多い。

ライバルのビデオエディターと違ってVOCHIは、エフェクトやフィルターのほぼ60%を無料で使える。無料に伴う制限は、何もない。他のビデオ編集ツールやコンテンツと併用してもよい。エフェクトの設定や、ユニークなプレゼン、さまざまな特殊エフェクトなどの高度な機能はサブスクリプションを要する。ただしそのサブスクリプションは、週7ドル99セントまたは12週39ドル99セントとお安くない。それは、ときどきビデオの制作を楽しみたいというカジュアルなユーザーよりも、プロのコンテンツクリエイターをユーザーとして想定しているからだ。アプリを150ドルで買い切り、という使い方もある。

同社によると、これまで、VOCHIの月間アクティブユーザー50万のうち約2万が有料ユーザーで、しかもそれは毎月20%ずつ増えている。


画像クレジット: VOCHI

でも、VOCHIが公表した数字は、同社がこれまで達成したことに比べればあまり重要ではない。

同社のビジネスが成長していたその同じ時期に、独裁政権が反対勢力を弾圧し、国中に逮捕と暴力が氾濫した。昨年は米国に本社のあるエンタープライズ系スタートアップPandaDocの複数の社員が、ミンスクでベラルーシの警察に逮捕された。それは、ルカシェンコ大統領に対する抗議への報復だった。4月には、ミンスクにおける同国のスタートアップとイベントとコワーキングスペースのハブであるImaguruが、同じくルカシェンコ政権によって閉鎖された。この古い建物でこれまで、Facebookが買収したMSQRDを初め、多くのスタートアップが誕生した。

関連記事: ベラルーシ政権が暴漢・圧力で同国の重要なスタートアップハブImaguruに閉鎖を強いる

その間、VOCHIは世界126か国のApp StoreでApp of the Dayとしてフィーチャーされ、月間収益はほぼ30万ドルにまで成長した。

VOCHIのインキュベーターだったBulba VenturesのゼネラルパートナーAndrei Avsievich氏は、こう述べている: 「パーソナルビデオは私たちの生活の中でますます重要な地位を占めるようになり、多くの人びとにとって、自己表現の手段になっている。VOCHIは、人びとがこのインスピレーションと学習の小道を辿ることを助け、ビデオによる創造性のためのツールを提供している。ユーザーや投資家がVOCHIを愛していることは、とても嬉しい。そのことは、収益と、応募超過の投資ラウンドの両方に表れている」。

今回の新たな投資はVOCHIをシリーズAに導き、彼らの仕事が今後ますます多くのクリエイターを惹きつけ、ユーザーエンゲージメントを向上し、アプリにもっと多くのツールを加えていくことに貢献するだろう。

関連記事: 10 VCs say interactivity, regulation and independent creators will reshape digital media in 2021(未訳、有料記事)

(文:Sarah Perez、翻訳:Hiroshi Iwatani)
画像クレジット: VOCHI

[原文へ]

あらゆるアプリとデバイスに顔認識能力を与えるBanubaが700万ドルを調達

ロンドン中心部の公園を見下ろすViktor Prokopenya(ヴィクトル・プロコペニア)のオフィスに足を踏み入れると、その質素さのあまり、そこがロンドンのビクトリア駅のすぐ南という最上の立地であることをつい忘れてしまう。巨大企業が拡張現実(AR)を「現実の産業」にするために世界で戦っている中、ベラルーシ出身のこの温和なビジネスマンは、その業界に革新的な新技術を投げ込む準備をここでしている。それは、世界最大の企業が今すぐにでも飛びつきたい技術ではあるが、キッチンに立って私にコーヒーを入れてくれたこの人は、そうした大企業の上に立ってもおかしくない人物だ。

目前の将来像が明確であるか否かは別として、十分な投資がなされれば、ARの未来は確かだ。

2016年、ARとVRの業界は、23億ドル(約2億6100億円)相当の投資を引き寄せた(2015年に比べて3倍の伸びだ)。2021年までには1080億ドル(約12兆2500億円)に達すると期待されている。その25パーセントはAR分野に向けたものとなる。しかし、数々の予測によれば、ARは5〜10年後にVRを追い抜くという。

Appleは、明らかにAR開発の先陣を切っている。先日、ARレンズの企業Akonia Holographicsを買収し、今月公開されるiOS 12からは、開発者はARKit 2を完全に使えるようになる。カメラを中心としたアプリの新しい波を起こそうという狙いがあることは、明らかだ。今年、Sequoia Capital Chinaとソフトバンクは、ARアプリ「Snow」に5000万ドル(約56億7600万円)を投資した。Samsungは、独自バージョンのARクラウドを発表し、ワコムとの提携により、Samsung製のSペンをARの魔法の杖に変えた。

IBMとUnityとの提携では、UnityのアプリケーションにWatsonのクラウドサービスを統合することで、開発者は、視覚認識、音声の文字化など、数多くの機能が使えるようになった。

こうした多額の投資やM&Aを見るに、ARの重要性が増していることは疑いようがない。

この戦場に参戦するのが、ProkopenyaのBanuba(バヌーバ)プロジェクトだ。もうすでに、App Storeから「Banuba」というSnapchatに似たアプリをダウンロードできるが、そのベースには、Prokopenyaが資金提供をしているツール一式がある。彼は、AIとARの専門家を擁する投資チームと密接に行動し、ものすごく大きなビジョンを実現しようと努力している。

Banubaの売り文句の中心にあるのは、アプリだけでなく、ハードウエアにも「視覚」を与える技術のアイデアだ。これはAIとARの完璧なマリアージュだ。たとえば、AmazonのAlexaが声を聞くだけでなく、ユーザーの表情や気分を読み取ることができたとしたらどうだろう? それが、この成長途中の企業の、人々の心を掴む強力な戦略になっている。

一般消費者向けのアプリとして名前を売ったBanubaは、去年1年をかけて、彼らのコンセプトを実際の市場で効率的に試すことができたわけだが、これからいよいよ、新しいBanuba 3.0 mobile SDKで、開発ツールの世界に本格参入する(SDKはiOS用がApp Storeで、Android用がGoogle Play Storeでダウンロードできる)。また同社は、Larnabel Ventures、ロシアの起業家Said Gutseriev、そしてProkopenyaのVP Capitalから700万ドル(約7億9500万円)の追加投資を受けた。

これにより、投資総額は1200万ドル(約13億6200万円)となる。ARの世界は、ロミュランのウォーバード戦闘艦がスタートレックの場面に登場したときのような雰囲気になっている。

Banubaは、そのSDKを使うことで、ブランドやアプリメーカーは、そのアプリに3D顔認識ARを埋め込み、ユーザーは最先端の顔の動作追跡、表情の解析、さらに肌を滑らかにしたり顔色を整えたりといった機能が利用できるようになると期待している。BanubaのSDKには、背景を除去する機能もある。映画やテレビ番組でよく使われている「グリーンスクリーン」のようなものだ。これにより、ユーザーが作り出せるARのシナリオの幅が広がる。オフィスの背景を取り除いて、代わりにバハマの海岸の風景を入れるといった魔法のような画像処理が可能になるのだ。

Banubaの技術はデバイスに「視覚」を与えるものであるため、デバイスは人間の顔を3Dで「見て」、たとえば年齢や性別といった、ニューラルネットワークに基づく有用な主題分析結果を抽出できるようになる。他のアプリでは不可能だったことを可能にするのだ。さらに、心拍数をモニターしたり、スペクトル分析で時間ごとの顔色の変化を知ることもできる。

この技術はすでに、「Facemetrix」というアプリに採用されている。これは、子どもの目の動きを追跡して、スマートフォンやタブレットに表示された文章を呼んでいるかを確かめるというものだ。この技術を使えば、人の目の動きを「追跡」するだけでなく、人の目の動きでスマートフォンの機能を操作することも可能になる。それを実現させるために、このSDKは、人の目の微細な動きをサブピクセルのレベルで、リアルタイムに感知できるようになっている。目の特定の位置を検出することもできる。Facemetrixが目指すのは「教育のゲーム化」だ。子どもが電子ブックを本当に読んだかどうかをアプリが正確に検知し、その結果を両親に報告し、子どもにはご褒美のゲームや娯楽アプリを提供する。

この話からドラマ『ブラック・ミラー』のエピソードを思い出した人もいるだろう。脳のインプラントによって特定のものを見えなくされた少女の物語だ。その心配は、そう外れてはいない。ただし、こちらは安全なバージョンだ。

BanubaのSDKには「アバターAR」も含まれている。すべてのiOSとAndroidデバイスで、アバターと会話したりカスタマイズできる機能を提供し、クリエイティブなデジタル・コミュニケーション方法を、アプリ開発者に生み出してもらおうという考えだ。

「私たちは今、既存のスマートフォンから、進化したメガネやレンズといった未来のARデバイスへと切り替わる微妙なところにいます。そのため、カメラを中心としたアプリの重要性は、これまでになく高まっています」とProkopenyaは話す。彼によれば、ARKitやARCoreでは最上位機種のスマートフォンを対象にした機能が作れるが、BanubaのSDKなら、下位機種でも使える機能を開発できるという。

このSDKには、楽しいアバターと会話したり、自分だけのアバターを作ったりできるアバターAR機能があるが、これはすべてのiOSデバイスとAndroidデバイスに対応する。アニ文字が楽しめるのはiPhone Xだけだなんて、面白くないではないか。

Facebookは、Messengerでの企業向けの商品紹介機能に続き、ニュースフィードでのAR広告のテストを開始した。この知らせも、Banubaにとっては有利なものだ。

Banubaの技術は、娯楽アプリ専用ではない。2年足らずの間に、同社は25件の特許申請をアメリカの特許商標庁に出願している。そのうち6件は、平均よりも短い期間に記録的な早さで手続きされた。ミンスクにある同社の研究開発センターには、50名のスタッフが技術ポートフォリオの作成に力を入れている。

面白いことに、ベラルーシはAIと顔認識技術で知られるようになった。

たとえば、2016年を思い出してみると、当時、App Storeで大人気だった動画フィルターアプリ「MSQRD」を開発したミンスクの企業MasqueradeをFacebookが買収している。2017年には、別のベラルーシの企業AIMatterがGoogleに買収されている。200万ドル(約2億2700万円)の資金調達をした数カ月後だ。AIMatterも、モバイル上で写真や動画のリアルタイム編集を行うプラットフォーム「Fabby」を公開し、SDK戦略をとっていた。これは、ニューラルネットワークをベースにしたAIプラットフォームの上に構築されたものだが、ProkopenyaがBanubaに抱いている計画は、もっと大胆だ。

2017年の初めに、彼とBanubaは「Technology-for-Equity」(平等のための技術)プログラムを立ち上げ、世界中のアプリ開発者やパブリッシャーに参加を呼びかけた。これには、また別のベラルーシのスタートアップが加わり、ARベースのモバイルゲームを開発することになった。

AR関連の技術は「実質的にあらゆる種類のアプリを発展させます。どのアプリも、カメラを通して、男性か女性か、年齢、人種、ストレスの度合いといったユーザーの様子を知ることができます」とProkopenyaは話す。そしてそうしたアプリは、さまざまな方法でユーザーに関わってくるという。文字通り、アプリは私たちを見張ることになるのだ。

たとえば、フィットネス・アプリなら、BanubaのSDKを使ってユーザーの顔を見るだけで、どれだけ体重が減ったかがわかるようになる。ゲームも、ユーザーの表情から手がかりを読み取り、そこから得られた情報に基づいて内容を変えるといったことが可能になる。

ロンドンのオフィスに戻り小さな公園を見下ろすと、Prokopenyaは「多様性とエネルギーとチャンスが信じられないほど集中した」ロンドンに、叙情的な気分を抱く。「でも、ひとつだけ気になるのは、イギリスのUK離脱にまつわる不透明さと、今後、イギリスでビジネスをしていく上で、それがどういう意味を持つかです」と彼は懸念する。

ロンドンは偉大な都市かも知れない(これからもそうあるだろう)、しかし彼の机の上に置かれたノートパソコンは、ミンスクに直結している。そこは、今まさに、未来の顔認識技術が生まれようとしている場所だ。

[原文へ]
(翻訳:金井哲夫)