ベンチャー情報のentrepediaなどを提供するジャパンベンチャーリサーチ(JVR)が日本のスタートアップ企業9000社をFintech、Healthtechなど32の領域に分類して視覚化する「ベンチャーマップ」を公開した。「Healthtech→医療情報→医師検索」などとドリルダウンしていけるクラスターツリーとして表示できるほか、企業数や従業員数、調達金額などに応じて面積で視覚化する、いわゆるツリーマップとしても表示できる。
ベンチャーマップは経産省からの委託によってJVRが作成したもの。JVR代表取締役の北村彰氏によれば、これは事業会社のCVCやR&D部門がスタートアップ企業発掘のための「地図」として提供するもので、経産省では施策の欠落部分を探ろうという意図もあるのだという。
マップ作成にあたっては、ネット上にあるテキストを分析して動的にマップやツリーを生成するシステムを新たに開発した。検索エンジンのBingや、Wikipedia、当該企業のWebサイトなどからテキストを収集し、これをJVRがメンテナンスしてきた約9000社のスタートアップ企業データベースと組み合わせたそうだ。
まったく人手を不要とするほどの自動化はさすがにできていないものの、クラスターツリーのトップレベルに入るべきキーワードを指定して「種まき」をすると、それ以後のツリーはシステムを3日ほど回すだけで自動生成するという。マニュアルによる重複やノイズ除去の必要性があるものの、「スタートアップらしさ」などをシステムが学習していくことで、今後も常に情報を最新の状態を保っていけるという。
スタートアップ情報の可視化だと、この業界では「カオスマップ」というフォーマットが使われることが多い。領域ごとにロゴをグルーピングするもので、ロゴが数多くひしめいていること自体がホットな領域であるという情報を示しているとはいえ、なかなかアップデートが追いつかないとか、実際の規模感を捨象しているというマイナス面があるのも事実。動的に更新される今回のようなベンチャーマップは便利かもしれない。今回の可視化では、キーワードのクラスタリングによって企業ごとに5個程度のキーワードを付けて分類するということをしている。このキーワードを動的に変えながら企業を探す「連想検索」も実装されている。
今回開発したシステムはベンチャーマップということだが、クラスターツリーを作るシステム自体は汎用性がある。なので、JVRとしては今後は特定領域の研究論文を分類するとか、特定産業領域への適用で、大企業のR&D部門とシステム開発をする可能性も模索していくそうだ。「われわれが全てを作るのではなく、各企業と一緒に作っていってシステムサービサーになるイメージです。化粧品なら化粧品のクラスタツリーができるでしょうし、自動車なら自動車となります」(JVR北村氏)。文献のクラスタリングはずいぶん長く研究されていて、システムがある気もするが、R&Dの現場では案外ググっているそうでイノベーションの発掘に時間がかかっているという課題があるという。
念の為に付け加えておくと、われわれTechCrunchにもCrunchBaseというグローバルなスタートアップデータベースがある。日々取材する中で随時情報を追加していっているが、CrunchBaseは誰でも編集が可能なWikipediaモデルなので、日本のスタートアップ関係者の方々には企業概要や人物、資金調達状況などを英語でどんどん入力していってほしい。