人が世界を理解するように因果関係をAIの意思決定に導入するノーコード技術のcausaLensが51.8億円調達

今日までの人工知能の最も一般的なアプリケーションの1つは、過去のデータで訓練されたアルゴリズムを使って予測を行い、将来の結果を判断するというものである。しかし、普及が必ずしも成功を意味するわけではない。予測AIは、結果につながる多くのニュアンス、コンテキスト、因果関係の推論を除外する。一部の人たち指摘しているように(そして私たちが見てきたように)、これは予測AIが生み出す「論理的な」答えがときとして悲惨なものになることを意味している。causaLens(コーザレンズ)というスタートアップは、因果推論(causal inference)技術の開発を行っている。この技術は、AIベースのシステムにニュアンス、推論、因果関係の知覚能力を導入する上でデータサイエンティストを必要としない、ノーコードのツールとして提供されており、この問題を解決できると同社は考えている。

causaLensのCEOで共同創業者のDarko Matovski(ダーコ・マトフスキー)氏は、AIが「人間が世界を理解するように世界を理解し始める」ことを目指していると語る。

同社は米国時間1月28日、このアプローチが初期にある程度成功し、1年前にステルス状態から脱して以来収益が500%成長したことを受けて、4500万ドル(約51億8000万円)の資金調達を行ったことを発表した。これはラウンドの「最初のクロージング」と表現されており、引き続きオープンで、規模拡大のポテンシャルを秘めていることを示唆している。

Dorilton Ventures(ドリルトン・ベンチャーズ)とMolten Ventures(モルテン・ベンチャーズ、Draper Esprit[ドレイパー・エスプリ]からブランド名を変更したVC)がこのラウンドをリードし、以前からの支援者であるGeneration Ventures(ジェネレーション・ベンチャーズ)とIQ Capital(IQキャピタル)、そして新たな支援者としてGP Bullhound(GPブルハウンド)も参加した。情報筋によると、ロンドンに拠点を置くcausaLensは、同ラウンドで約2億5000万ドル(約287億8000万円)と評価された。

causaLensの現在の顧客やパートナーには、ヘルスケア、金融サービス、政府機関の他、多岐にわたる業界の組織が名を連ねている。こうした組織は、成果に到達する過程において、AIベースの意思決定だけではなく、より多くの因果関係のニュアンスを取り入れる目的で、同社の技術を活用している。

この仕組みの実例を挙げると、同スタートアップのパートナーの1社であるMayo Clinic(メイヨー・クリニック)は、causaLensを使って癌のバイオマーカーを同定している。

「人間の身体は複雑なシステムであり、基本的なAIパラダイムを適用することで望みどおりのパターンや相関関係を見つけることは可能ですが、成果を得ることはできません」と、同スタートアップのCEOで創業者のDarko Matovski(ダルコ・マトフスキー)氏はインタビューで語っている。「ですが、因果関係の手法を応用して、相違する身体がどのように機能するのかを理解すれば、ある組織が別の組織にどのような影響を与えるのか、その本質をより深く理解することができます」。

関連するすべての変数を考慮すると、それは人間にとって、あるいは人間のチームにとっても、計算することはほぼ不可能なビッグデータの問題である。しかしコンピューターにおいては、対処すべき必要最低限のものと位置づけられる。これは癌の治療法ではないが、この種の研究は、関与する多くの組み合わせに応じた多様な治療法を検討する上で、意義のある一歩である。

causaLensの技術は、ヘルスケア分野でも、あまり臨床的ではない形で応用されている。世界有数の経済大国に属する公衆衛生機関(causaLensはそれについて公表を控えている)は、同社のCausal AIエンジンを使用して、特定の成人が新型コロナウイルスのワクチン接種を躊躇している理由を特定し、その人たちを参加させるためのより良い戦略を考案した(ここでは複数の「戦略」が運用上の細目となっている。対象者によってさまざまな理由を含む複雑な問題であるということに要点がある)。

金融サービスのような領域の他の顧客は、causaLensを使って、ローン評価などの分野における自動化された意思決定アルゴリズムに情報を与えている。従来のAIシステムは、過去のデータのみを使って意思決定にバイアスを導入するものであった。一方ヘッジファンドでは、causaLensの活用により、市場のトレンドがどのように発展して投資戦略に反映されるかについてより深い洞察を得ている。

そして興味深いことに、自動運転輸送の世界に新たな顧客の波が現れているかもしれない。これは、人間の推論の欠如によって分野の進歩が妨げられてきた領域の1つである。

「どれほど多くのデータが自律システムに送られても、それは歴史的な相関関係にすぎません」とマトフスキー氏はこの課題について語っている。同氏によると、causaLensは現在、2つの大手自動車会社と同社の技術の「数多くのユースケース」について協議を進めているが、その中でも特定のユースケースとして「世界がどのように機能するかをシステムが理解する」ような自動運転に注目しているという。「それは、赤信号や停車中の車に関連する相関ピクセルだけではなく、その車が赤信号で減速することでどのような結果が生じるのかも考慮したものです。私たちはAIに推論を導入しています。自動運転において、Causal AIは唯一無二の希望です」。

AIを仕事で使用している人たちが、システムをできる限り正確にしたいと考えるのは当然のことのように思える。それは、そもそもなぜCausal AIによる優れた改善がAIアルゴリズムや機械学習に組み込まれていないのかという疑問を抱かせる。

初期の段階において、推論や「なぜ」と返答することの追求を優先していなかったわけではないとマトフスキー氏は説明する。「人々は長い間、科学の中で因果関係を探求してきました。ニュートンの方程式は因果を示すものであると主張することもできます。それは科学において極めて基本的なことです」。しかしAIの専門家たちは、機械にそれを教える方法を解明できなかったのである。「それは難しすぎました」と同氏は語る。「アルゴリズムとテクノロジーが存在していませんでした」。

同氏によると、その状況は2017年あたりから変化し始めたという。それは研究者らが、AIにおける「推論」や因果関係の表現方法について、既存の成果への貢献を示す信号を発見する(過去のデータを使って成果を決定するのではなく)ことに基づいて検討し、それに立脚したモデルを構築するという初期アプローチを発表し始めた時期である。興味深いことに、これはマトフスキー氏が言及している、仕事をするために大量のトレーニングデータを取り込む必要がないアプローチである。causaLensのチームは、博士号にかなりの比重が置かれている(同スタートアップはここで本格的にドッグフーディング[事前に自身で有用性を確かめる]を実践したといえるかもしれない。チームを編成する際に5万人の履歴書を検討している)。そしてこのチームは、そのバトンを受け取って、それで走り続けてきた。「以来、指数関数的な成長曲線を描いています」と同氏は語っている(その詳細はこちらで確認できる)。

AIに依存する大規模プロジェクトで因果推論の進歩を活用する方法を検討しているのは、causaLensだけではない。Microsoft(マイクロソフト)、Facebook(フェイスブック)、Amazon(アマゾン)、Google(グーグル)など、AIに多額の投資をしている大手テック企業もこの分野に取り組んでいる。スタートアップの中では、Causalis(コーザリス)も特に医薬とヘルスケアでCausal AIを使う機会に焦点を当てており、Oogway(ウーグウェイ)は消費者向けのCausal AIプラットフォームを構築しているようである。これらはすべて、特定の商用、そしてより一般的なユースケースの両方をカバーする、より広範で大規模な当該技術市場が開拓される機会を示している。

「AIは、現実世界におけるポテンシャルを実現するために、因果推論に向けた次のステップを踏み出さなければなりません。causaLensは、Causal AIを活用して介入をモデル化し、機械駆動型の内省を可能にした最初の企業です」とDorilton VenturesのDaniel Freeman(ダニエル・フリーマン)氏は声明で述べている。「このワールドクラスのチームは、本格的なデータサイエンティストの心を掴む洗練性と、ビジネスリーダーに力を与えるユーザビリティを備えたソフトウェアを開発しました。Dorilton Venturesは、次のステージでcausaLensをサポートすることに大きな喜びを感じています」。

「どの企業もAIを採用するようになるでしょう。単に採用できるからではなく、採用する必要があるからです」とMolten Venturesの投資ディレクターであるChristoph Hornung(クリストフ・ホルヌング)氏は付け加えた。「私たちMoltenは、因果性がAIのポテンシャルを引き出すために必要となる重要な要素であると確信しています。causaLensは、最適なビジネス上の意思決定へとデータを変換する能力が証明されている、世界初のCausal AIプラットフォームです」。

画像クレジット:Andriy Onufriyenko / Getty Images

原文へ

(文:Ingrid Lunden、翻訳:Dragonfly)

どんどん増える画像や動画に特化したデータベースを開発するApertureDataが約3.5億円のシード資金を調達

Vishakha Gupta(ビシャカ・グプタ)氏と、後に共同創業者になるLuis Remis(ルイス・レミス)氏は2016年にIntel Labsでともに働いていた頃、どんどん増えるビジュアルデータ(画像やビデオ)をどう管理するかを解決する業務を任されていた。2人はこの問題に精力的に取り組み、研究者やデータサイエンティストとも協力して、大量のビジュアルデータに適したインフラの開発を始めた。

結局、画像を扱い、データサイエンティストが利用する要件を満たす新しいデータベースが必要であるとの結論に達した。データサイエンティストは画像データを処理するために複数のシステムを扱う必要があり、これは非効率で時間がかかることがわかった。2人はもっと良い方法があるはずだと考え、Intelにまだ在籍していた2017年に、1カ所であらゆる処理ができるデータベースを構築するためのシステムに取り組み始めた。

2人はこの仕事がスタートアップになる素地を備えていると考え、2018年にIntelを退社してApertureDataという企業を始めた。正式に創業したのは2018年後半で、現在も引き続きこの問題に取り組んでいる。

最終的に開発したソリューションはApertureDBという名前のクラウドアグノスティック(特定のシステムに依存しない)データベースで、画像を処理することに関連するあらゆるデータ(メタデータなど)を1カ所で扱うことに特化して設計され、自動化することで手作業でデータを検討する時間のかかるステップを省くことができる。

グプタ氏は「もし私がデータサイエンティストで、データを見て何が起きているかを把握する立場だとしたら、データの検討に(相当長い)時間を費やさなくてはならないでしょう。(これまでは)このようなタイプのデータやこのようなタイプのユーザーを理解できるデータベースがなかったからです」と説明する。

さらに同氏はこう続ける。「それがこの問題を解決しようとするきっかけになりました。私と共同創業者はIntelにいたときにこの問題に直面していました。そして自分たちのためにこの問題を解決するのであれば、このインフラを構築している間にどうすればもっと多くの人のためにこの問題を解決できるかを探ろうと考えました。その結果としてApertureDataを創業し、ApertureDBをプロダクトとして提供することになりました」。

同社の従業員数は現在8人で、2022年末までに15〜20人にすることを目指している。グプタ氏は、女性創業者として多様性のあるチームを構築することの重要性を、そして2人の子を持つ母としてワークライフバランスの重要性も強く認識している。

同氏は「スタートアップで働くなら私的な部分は犠牲にしなくてはいけないというシリコンバレーの古い考え方があることをご存じでしょう。(私たちの考えでは)実はバランスをとることもできるし、多様性も実現できます。最初から多様であることが重要です」と述べた。

米国時間2月8日、ApertureDataはプロダクト開発を継続するための300万ドル(約3億4500万円)のシード資金調達を発表した。このラウンドを主導したのはRoot Venturesで、他にWork-Bench、2048 VC、Graph Ventures、Alumni Ventures Group、Magic Fundと、業界のエンジェルも参加した。

このラウンドがクローズしたのは2021年10月だった。それ以前は、全米科学財団の助成金、友人や家族からの資金、そして昔ながらのブートストラップでプロダクトを開発していた。

画像クレジット:Dimitri Otis / Getty Images

原文へ

(文:Ron Miller、翻訳:Kaori Koyama)

仙台市と東北大学がKaggleを用いAI・データサイエンスの実践スキルの習得を目指す講座を開講、受講者募集開始

仙台市と東北大学がKaggleを用いAI・データサイエンスの実践スキルの習得を目指す講座を開講、受講者募集開始

宮城県・仙台X-TECH推進事務局は、東北大学大学院情報科学研究科と連携し「データサイエンス・トレーニングキャンプ」をオンライン開催(Zoom)すると発表。受講者の募集を開始した。受講者募集期間は2月14日12:00まで。開講日程は、2月24日から3月12日。修了時には、東北大学大学院情報科学研究科による修了証が授与される。

これは、AIを用いたデータ分析の手法とデータサイエンスの実践スキルを学ぶための講座だ。仙台X-TECH推進事務局は、仙台市をフィールドに、最先端IT技術と様々な産業を掛け合わせたX-TECH(クロステック)による新事業創出を推進しており、AI関連ビジネスが持続的に生まれるエコシステム「AI-Ready都市・仙台」を目指す「仙台 X-TECHイノベーションプロジェクト2021」の一環として開催する。

募集対象者は、仙台または東北に本社や事業拠点を置く企業や団体に所属する個人で、これまでに仙台X-TECHイノベーションプロジェクトのプログラムやワークショップに参加したことのある人、AIやデータサイエンスに関心の高いエンジニア(経験はスキルは不問)、またはAIビジネス創出を支援するITベンダーのエンジニア(プログラミング未経験でも可)のいずれかに該当する者となっている。

講師は、東北大学大学院情報科学研究科教授の中尾光之氏と、同研究科准教授の山田和範氏。

AIコンペティション・プラットフォームKaggleから厳選したプロジェクト2つにおいて、参加者間で3名程度のチームを組成の上、前半(Day 1〜5)、後半(Day 5〜9)それぞれハンズオン講義+チーム活動にてビッグデータ分析を通した課題解決に取り組む。

概要

  • 開講日程:2月24日〜3月12日
  • 会場:Zoomによるオンライン開催
  • 受講者募集期間:2022年2月14日12:00まで
  • 募集人数:20名(応募多数の場合は抽選)
  • 参加費:無料

申し込みは、特設サイト「東北大学 x 仙台市 データサイエンス・トレーニングキャンプ」より行う。

コラボレーション型データサイエンス用ノートブック開発のためにDeepnoteが23.1億円調達

Jupyter(ジュピター)互換のノートブックの上に、データサイエンスのためのプラットフォームを構築しているスタートアップのDeepnote(ディープノート)が、米国時間1月31日、2000万ドル(約23億1000万円)のシリーズAラウンドを実施したことを発表した。ラウンドを共同で主導したのはIndex VenturesとAccelだが両社は2020年のシードラウンドにも参加していた。今回のラウンドには、既存の投資家であるY CombinatorとCredo Venturesも参加している。

Deepnoteの共同創業者のJakub Jurovych(ヤコブ・ジュロビッチ)CEOが語ってくれたように、Deepnoteは数年前に設立されて以来、当初のビジョンにほぼ忠実であり続けている。

ジュロビッチはいう「起業したときに、私たちはデータサイエンスと機械学習のバックグラウンドを持っていました。そのときの私たちは、データサイエンスの分野で何かを変えて行く必要があると確信していました。というのも、ありとあらゆるツールを試していたのですが、何を試してもコラボレーションがうまくいかなかったからです」。

すでにJupyterノートブックに精通していた共同創業者のJan Matas(ジャン・マタス)CTOと、デザイン部門責任者のFilip Stollar(フィリップ・ストーラー)を含むチームは、この既存のツールへの、コラボレーションのためのより簡単な方法の導入に着手した。

画像クレジット:Deepnote

多くの点で、Deepnoteは共有型データサイエンスノートブックの業界標準になっている。現在、ByteDance(バイトダンス)、Discord(ディスコード)、Gusto(ガスト)などの企業が同社のプラットフォームを使用している。データサイエンス市場は急速に成長しているにもかかわらず、人材の確保が困難であるため、チームは同社のツールを学生に提供することにも力を入れている。現在、世界のトップ100大学のうち80大学が、少なくとも一部の授業でDeepnoteを使用している。

「学生や教師が感じている痛みは、他の組織で見られるものとほとんど同じです。同様のコラボレーションへの要求があるのです」とジュロビッチ氏はいう。1人の教授がこのツールを使って何百人もの学生に課題を配布できるように、企業ユーザーは自分のノートブックをトップ役員を含む社内の誰とでも共有できるようになるのだ。実際、ジュロビッチ氏は、ノートブックというフォーマットは、技術者と非技術者の間のギャップを埋めることができると考えている。そのため、Deepnoteはデータサイエンティストをターゲットにしているものの、チームの目標の1つは(Jupyter規格との完全な互換性を保ちながら)ノートブックを使用する際の参入障壁を下げることだ。

画像クレジット:Deepnote

ジュロビッチ氏は「2年前には、Pythonの書き方を知らなければ、ノートブックから何の価値も引き出すことができませんでした」という。「それが今では、チームの技術者である誰かからリンクを受け取れば、そのあと視覚化を微調整することはとても簡単なことなのです。コメントを残したり、フィードバックを行うためには、高い技術は必要ありません」。

Deepnoteには無料プランが用意されている。有料のProプランは12ドル/月/ユーザーからだが、学生や教師は無料で利用できる。

リモートファースト企業のDeepnoteは、今回の資金調達により、製品の開発とデータサイエンスコミュニティでの足場拡大を図る。ジュロビッチ氏は今後12カ月の間にチームの規模を2倍の約50人にすることを計画している。

画像クレジット:Deepnote

原文へ

(文:Frederic Lardinois、翻訳:sako)

データサイエンス領域スクール事業やオンライン受験システムを提供するデータミックスが総額2億3100万円調達

データサイエンス教育や監視機能付きオンライン受験システムなどを提供するデータミックスは1月17日、第三者割当増資により2億3100万円の資金調達実施を発表した。引受先はHCSホールディングス、滋慶、KIYOラーニング、Speee、IE ファスト&エクセレント投資事業有限責任組合(イノベーション・エンジン)、The Independents Angel 2号 投資事業有限責任組合(Kips)、AIX Tech Ventures、エッジ・ラボ、その他個人。

調達した資金により、データサイエンスに関連するサービスを通し国や地域を越えたデータサイエンスコミュニティを形成し、個人の成長・企業の成長力強化に貢献するため、以下の点を中心に強化する。

・データに基づいた、より学習効果の高いデータサイエンス教育カリキュラムとコンテンツの開発
・スクール受講生をはじめ顧客へのサービスの質向上に向けた体制強化と環境の構築
・データサイエンティスト育成プログラムなど各種サービス認知向上のための活動
・データサイエンス人材に特化した人材紹介サービスの営業および顧客サポートの強化
・オンライン受験システム「Excert」の開発・販売の加速
・人材の積極的な採用と社内の人材育成の強化

2017年設立のデータミックスは、データサイエンス領域でのスクール事業や企業研修・コンサルタント事業、データサイエンスビジネス事業開発などを展開している。主として統計学や人工知能、機械学習といったデータサイエンスの手法を駆使したデータ分析により、ビジネスの戦略設計ができる人材育成を行う。企業や個人に対し、年間約2200名以上(2020年度実績)にデータサイエンス関連の教育を提供しているという。

総務省、統計リテラシー向上を目的にデータサイエンス・オンライン講座「誰でも使える統計オープンデータ」開講

総務省、統計リテラシー向上を目的にデータサイエンス・オンライン講座「誰でも使える統計オープンデータ」開講

総務省は1月11日、統計リテラシー向上を目的として、データサイエンス力の高い人材を育成するためのデータサイエンス・オンライン講座「誰でも使える統計オープンデータ」を開講した。おもに社会人と大学生を対象に、統計オープンデータを活用してデータ分析の手法を解説する。

登録料および受講料は無料。申し込みは、講座紹介サイトから行え、3月7日まで誰でも受講登録できる。

同講座では、政府統計の総合窓口「e-Stat」、総務省および統計センターが提供する地図で見る統計(統計GIS。jSTAT MAP)、APIなどを使って統計オープンデータを活用したデータ解析手法が学べる。また週ごとに確認テストがあり、最終課題を経て修了証が発行される。

「誰でも使える統計オープンデータ」概要

  • 開講日:2022年1月11日
  • 学習時間:1回10分程度、週に5〜7回ほど、4週間
  • 前提条件:表計算ソフトMicrosoft Excelの基本的な操作ができること(簡単な計算や関数、グラフ作成などができればExcel以外でも問題ないが、講義はExcelを用いた説明となる)
  • 課題:各週の確認テストと最終課題の実施
  • 講師:⻄内啓⽒(統計家)、⼩⾕祐⼀朗⽒(不動産販売価格予測サイト「GEEO」開発者)、総務省統計局および統計センター職員

各週のテーマと内容

  • 第1週「e-Statを使ったデータ分析」:e-Statの統計データを活⽤したデータ分析の事例を学ぶ(e-Statの機能紹介、活⽤事例紹介など)
  • 第2週「公的統計データの使い⽅」:公的統計データの基本事項や読み⽅を学ぶ(公的統計の種類と体系、労働⼒調査・家計調査の基礎知識、利⽤の際のポイントなど)
  • 第3週「統計GISの活⽤」:統計データと地図を組み合わせた統計GISの活⽤⽅法を学ぶ(jSTAT MAPの機能紹介、簡単にできるレポート作成、活⽤事例紹介など)
  • 第4週「統計オープンデータの⾼度利⽤」:統計API機能の仕組みや具体的な活⽤事例など、統計オープンデータの⾼度な活⽤⽅法を学ぶ(統計APIの仕組み、統計オープンデータの活⽤事例、講座のまとめなど)

企業のセキュアなデータ活用を促進するデータカタログSaaSを手がけるQuollio Technologiesが5000万円のシード調達

データカタログSaaSによりデータガバナンスの実現を目指すQuollio Technologies(クオリオ)は1月11日、シードラウンドにおいて、第三者割当増資による5000万円の資金調達の実施を発表した。引受先はインキュベイトファンド。調達した資金はプロダクトの開発と組織体制の強化にあてる。またα版を近日リリースする予定。

現在データは「21世紀の石油」とも呼ばれるほど大きな存在となっており、様々なデータを資産として活用することが企業に求められている。しかしデータは、活用可能性と同時に誤用や漏洩・損害・賠償のリスクも含んでおり、未然防止が大きな課題となっている。そのため、「詳細がわからないデータについてはリスクを恐れ利用禁止にする」といった、データ活用そのものを萎縮させるという課題も発生している。

そうした問題を解決するための施策がデータガバナンスだ。データの入手背景や禁止事項などの詳細情報(メタデータ)を正しく理解し、リスクをカバーした状態でデータを活用するために欠かせないものとなっている。データ資産1つ1つのメタデータを管理し、より細かい粒度で制限することで、従来「アクセス禁止」「利用しないでおこう」とひとくくりで利用を否定していたデータに対して、「特定の条件下なら、このデータを使用しても大丈夫だ」といった柔軟な判断を可能とし、セキュアで自由なデータ活用を促進する。

データガバナンスは最近登場した新たな概念ではなく、DMBoK (Data Management Body of Knowledge) を筆頭に、2000年代から議論が重ねられてきた領域という。昨今では、企業の扱うデータ量が膨張し、データ利活用に関わる人数も増加している潮流から、データガバナンスを再び重要視する企業が増えているそうだ。

ただ、データガバナンスの概念自体の移り変わりの速さや、企業ごとに必要なデータ基盤・体制が大きく異なるためにデファクトスタンダードが生まれにくいという状況にある。特に日本では、市場を牽引するプレイヤー不足や経営側がデータ基盤について理解が浸透していないことから、海外よりも遅れを取っているという。こうした状況を解決するためクオリオは、データガバナンスに対する専門的な知見とデータ活用における現場オペレーションへの深い理解によって国内市場を牽引する存在となり、企業のデータ活用にイノベーションを起こすことを目指しているという。

クオリオは、「世界中の情報と知を繋げ、人類の新たな価値創造を促進する」をミッションに掲げ、2021年8月に設立。創業メンバーは、データサイエンスやデータエンジニアリングといった各領域におけるプロフェッショナルを中心に構成しており、データガバナンスの実現に向けた最初のソリューションとして、データカタログサービスの開発を行っている。

南アのクラウドソーシング「Zind」は現実の問題を解決するためにデータサイエンティストのコミュニティを構築、AIも活用

Zindi(ジンディ)は、AIを使用して企業や個人の現実の問題を解決することを目指している。そして、南アフリカを拠点とするこのクラウドソーシングスタートアップは、過去3年間それをずっと実践してきた。

ちょうど2020年、Zindiに参加するデータサイエンティストのチームが機械学習を用いてウガンダの首都カンパラの大気モニタリングを改善し、また別のグループはジンバブエの保険会社のZimnat(ジンマット)が行う顧客の行動予測(特に解約しそうなひとの予測や解約を思いとどまらせるための有効な手段の予測)を支援した。Zimnatは、他のやり方では解約していたであろう人びとにカスタムメイドのサービスを提供することによって、顧客の解約を防ぐことができた。

これらは、企業、NGO、政府機関がZindiに提示した、データ中心の課題に対して実現されたソリューションの一部だ。

Zindiはこれらの課題を発表し、データサイエンティストのコミュニティに対してソリューション発見コンテストに参加するよう呼びかけている。参加しているデータサイエンティストがソリューションを提出して、採用された者が賞金を獲得する。コンテストの主催者は、自身の課題を克服するために寄せられたもののうち最良の結果を利用することができる。たとえばウガンダ全土の大気汚染を予測するための解決策を模索しているAirQo(エアクオ)による大気質監視プロジェクトや、Zimnatの損失削減を支援することなどが解きたい課題だ。

関連記事:Zindiが新型コロナ対策に向け1.2万人のアフリカ人データサイエンティストを活用

「このおかげで、いまやAirQoは、一般の人々が大気質と大気質の予測を確認できるダッシュボードが提供できています。このプロジェクトのエキサイティングな点の1つは、AirQoがプロジェクトの実装を支援するためにコンテストから2人の勝者を採用したことです」とZindiの共同創業者でCEOのCelina Lee(セリーナ・リー)氏は述べている。他には南アフリカのMegan Yates(メーガン・イエーツ)氏とガーナのEkow Duker(エコー・ダッカー)氏が、プラットフォームの共同創業者だ。

リー氏は「AirQoはまた、彼らが構築したソリューションに対してGoogleから資金を調達し、他のアフリカ諸国にもそれを展開していく予定です」と語る。このコンテストはバーミンガム大学のDigital Air Quality East Africa(DAQ EA)ならびにカンパラのマケレレ大学のAirQoプロジェクトと提携して開催されたコンテストだったのだ。

Zindiは、アフリカ全土のデータサイエンティストのデータベースだ。このクラウドソーシングスタートアップは、最近100万ドル(約1億1300万円)のシード資金を調達した(写真クレジット: Zindi)

Zindiを利用した他の注目すべき民間および公的組織には、Microsoft(マイクロソフト)、IBM、Liquid Telecom(リキッドテレコム)、UNICEF(ユニセフ)、および南アフリカ政府が含まれている。スタートアップの、発足以来の成長を目の当たりにして、リー氏はZindiが達成できたことに興奮しており、コミュニティの将来に情熱を注ごうとしている。このプラットフォームは現在、代替手段を提供しており、アフリカ全土で事業を展開し、しばしば高額な従来のコンサルティング会社との競争を激化させている。

Zindiのユーザーは、2020年の初めから3倍に増え、大陸の45カ国から3万3000人のデータサイエンティストを集めるまでになっている。また、データサイエンティストたちに対して30万ドル(約3384万円)の対価を支払った。

この数は、Zindiが2022年3月に、大学生たちがさまざまな解決策を求めて互いに競い合う、3回目の大学間Umoja Hack Africaチャレンジを主催することで増加するだろう。

Zindiは、この大学間コンテストを利用して、学生を実用的なデータサイエンスの経験に従事させ、AIを使って実際の課題を解決させている。2020年のイベントは、パンデミックのためにオンラインで行われたが、プラットフォーム上に約2000人の学生が集まった。

サンフランシスコ出身のリー氏は「学生は最初の機械学習モデルを構築して、そこから、キャリアと教育へのあらゆる種類の扉が開かれます」と述べている。

Zindiには現在「学習から稼ぎまでの道のりを短くする」ためのジョブポータルが用意されている。組織は、人材配置ポータルに人材募集を投稿することで、そこにある人材のプールを活用することができる。

このクラウドソーシングプラットフォームは、新進のデータサイエンティストにトレーニング資料を提供する学習コンポーネントの導入も計画している。これは、プラットフォームが知識のギャップとトレーニングの必要性を認識したためだ。一方リー氏は、Zindiのユーザーのほとんどは、学習経験を必要としている学生や、世界の問題を解決するために高度なスキルを必要とする人たちであるという。

新しい計画は、最近プラットフォームが調達した100万ドルのシード資金によって可能になる。

画像クレジット: Zindi

リー氏は「私たちにとって、それはコミュニティを拡大し、すべてのデータサイエンティストにとってより多くの価値を生み出すことなのです」と語る。

「私たちが理解していることの1つは、特にアフリカでは、データサイエンスが非常に新しい分野であるということです。そのため、この資金を使って、より多くの学習コンテンツを導入していきます。そして、私たちのデータサイエンティストの多くは、まだ大学生か、キャリアの非常に早い段階にいます。彼らは、とにかく自分たちのスキルを学び身につける機会を探しているのです」。

シードラウンドは、サンフランシスコを拠点とするVCのShaktiが主導し、Launch Africa、Founders Factory Africa、FIVE35が参加した。

リー氏によれば、これらの計画はすべて、アフリカ大陸で強力なデータサイエンスコミュニティを構築することを目的としていて、近い将来、プラットフォームのユーザーを100万人に増やすことを目指しているという。これは、キャリアの初期段階にいるデータサイエンティストにトレーニングの機会を提供し、コラボレーションとメンターシップを促進する強力なコミュニティを形成することによって達成可能だと彼女はいう。

リー氏は次のように述べている「そして、最終的にはアフリカで100万人のデータサイエンティストにリーチしたいのですが、そのためにはデータサイエンスを、この分野で成功するキャリアを追求することに関心のある若い人なら誰でも、必要なツール、つながり、経験にアクセスできるようしたいと考えています」。

「私たちのビジョンは、誰もがAIにアクセスできるようにすることです」。

画像クレジット:Zindi

原文へ

(文: Annie Njanja、翻訳:sako)

データ活用支援のDATAFLUCTが2.5億円の資金調達、マルチモーダルデータプラットフォーム開発を強化

画像や動画、音声、文書などの異なる様式のデータを統合的に処理する「マルチモーダルデータ」の活用サービスを提供するDATAFLUCT(データフラクト)は11月22日、日本政策金融公庫の融資により2億5000万円を資金調達したことを発表。今回の資金調達は、「新株予約権付融資制度」を活用した融資により実施した。同制度は、新たな事業に取り組み株式公開を目指すベンチャー企業を対象に、融資と同時に日本政策金融公庫が新株予約権を取得することで無担保で資金を供給するというもの。これによりDATAFLUCTの資本性および負債性資金の累計調達金額は6億9000万円となった。

DATAFLUCTは2019年の創業以来、「データを商いに」というビジョンのもと、社会課題の解決を軸に各業界に特化したデータサイエンスサービスを展開。11月時点で公開したサービス数は20を超える。スタートアップの活躍が期待されるESGやSDGsの視点からも新たな課題に取り組み、7月には「脱炭素」を事業機会に変えるアイデアとして、決済データから消費のカーボンフットプリントを可視化するサービスを公開し、事業化に向けた取り組みを進めている。

企業の9割以上の企業がDXに着手できていないという現状の中(経済産業省「DXレポート2(中間取りまとめ)」)、DATAFLUCTは多数の大手企業のDXを支援してきた。今回調達した資金は、マルチモーダルデータプラットフォームサービスを中心とした新規サービス開発および既存サービスの強化、マーケティング強化にあてられる。構造化・非構造化を問わず、あらゆる種類のデータをつなげて資産化し、ノーコード、エンドツーエンドで活用できる環境を提供する「マルチモーダルデータプラットフォーム構想」の実現に向け、新規サービスの投入および既存サービスの強化に順次取り組む予定。

11月下旬には、ノーコードのエンドツーエンド機械学習プラットフォーム(マルチクラウドAutoML)「DATAFLUCT cloud terminal.」をリニューアル。12月中旬には新規サービスとして、社内に散在するデータや外部のオープンデータの集約のほか、非構造化データの構造化などの前処理をAI技術で実行しカタログ化するデータレイク/データウェアハウス「AirLake」(エアーレイク)を提供開始する予定。データ活用支援のDATAFLUCTが2.5億円の資金調達、マルチモーダルデータプラットフォーム開発を強化

今後も、SCM(サプライチェーンマネジメント)のための需要予測プラットフォームサービスやノーコード対話型BIプラットフォームサービスを投入し、オールインワンでソリューションを提供するため事業の強化を目指す。これまでに分析の材料とされていなかったデータを利用したり、データ同士を新たに組み合わせられる環境を提供することで、これまでにない洞察を獲得できる「データの資産化」を推進するサービスを継続的に開発し、専門知識や技術の有無にかかわらず利用できるUI/UXの採用によってデータ活用人材の拡張を図りたいという。

インフラ危機をゲームで解決!? マンホール蓋をスマホで撮影・投稿しポイントを稼ぐ#マンホール聖戦 〜東京23区コンプ祭り

日本のインフラ危機をゲームで解決!? マンホール蓋をスマホで撮影・投稿しポイントを稼ぐ#マンホール聖戦 〜東京23区コンプ祭り

市民参画型インフラ情報プラットフォームの構築・提供・運営を行うWhole Earth Foundation(WEF。ホール・アース・ファウンデーション)は10月22日、日本鋳鉄管と共同で開発し提供するゲーム「鉄とコンクリートの守り人」において、東京23区を対象に「#マンホール聖戦 〜東京23区コンプ祭り〜」を期間限定で開催すると発表した。開催期間は、2021年10月31日まで。対象は17歳以上。全国の方もサポート役で参加できるほか、様々な条件達成により獲得可能な計100万円以上相当分の金券を賞品として用意しており、お祭り要素のあるイベントとしている。

鉄とコンクリートの守り人は、国内のインフラ老朽化の課題に対し、日本にあるすべてのマンホール蓋を守り人(プレイヤー)が力をあわせて撮影・投稿しポイントや特典を得ながら、インフラの安全を確保することを目的とした「社会貢献型位置情報ゲーム」。マンホールコンプというゲーム性を採用し、写真の投稿やレビューによって日本全国のマンホール地図を力を合わせて完成させることを目指す。

日本のインフラ危機をゲームで解決!? マンホール蓋をスマホで撮影・投稿しポイントを稼ぐ#マンホール聖戦 〜東京23区コンプ祭り

2021年8月開催の第1回「マンホール聖戦IN渋谷」では約700人の参加者が集まり、渋谷区にある1万個のマンホールを3日間でコンプリートした。第3回目となる今回の「#マンホール聖戦」は、ゲームの参加者が協力しながら、過去最大規模の23区のマンホールのコンプリートする。

イベントに参加するには、「公式LINEに登録&詳細確認」を行い、LINE内にあるURLからウェブアプリに登録する。遊び方は、「東京23区 現在位置登録&投稿」「全国マンホール探索」「全国写真レビュー」の3種類。日本のインフラ危機をゲームで解決!? マンホール蓋をスマホで撮影・投稿しポイントを稼ぐ#マンホール聖戦 〜東京23区コンプ祭り

  • 東京23区 現在位置登録&投稿:近くのマンホールまで行き位置録後、「場所と状況がわかる写真」と「マンホールの蓋の写真」の2つをセットでアップロードする。プレイ時間は午前6時~午後6時まで
  • 全国マンホール探索:アプリ内で衛星写真を使ったマンホール探索を行い位置登録を行う
  • 全国写真レビュー:マンホール現場から投稿された写真をアプリ上でレビューする

WEFは「We Democratize Infrastructure Management」(インフラマネジメントを民主化する)というビジョンのもと、市民参画型のインフラ情報プラットフォームの構築・提供・運営を行うNPO。

人口が減少している日本において、老朽化が進むインフラにかかるメンテナンスコストの大きな負担が未来世代に転嫁されるのは、構造的に避けられない。この現状を打開すべく、WEFはゲーミフィケーションとデータサイエンス技術を活用し、インフラを利用する市民が主体的に参画する形でインフラ産業の革新を進めることに挑戦しているという。

WEFは、日々当たり前のように各種インフラを利用しているのにもかかわらず、その管理・運営体制がどうなっているのかを知るのは困難と指摘。そこで、インフラの実態を可視化することによって、情報の非対称性解消に寄与するとしている。またWEFは、公共の利益に資する情報を提供した市民ユーザーに対してインセンティブを付与し、高効率かつ低コストのインフラ維持管理プラットフォームを構築し、その普及推進に取り組むとしている。日本のインフラ危機をゲームで解決!? マンホール蓋をスマホで撮影・投稿しポイントを稼ぐ#マンホール聖戦 〜東京23区コンプ祭り

日本のインフラ危機をゲームで解決!? マンホール蓋をスマホで撮影・投稿しポイントを稼ぐ#マンホール聖戦 〜東京23区コンプ祭り

アスクルが「数理・データサイエンス・AI教育プログラム」賛同、大学など教育支援で事業課題やデータ提供・指導員で協力

  1. アスクルが「数理・データサイエンス・AI教育プログラム」賛同、協力企業として大学などの教育を支援

事務用品の販売などを手がけるアスクルは、10月19日、内閣府、文部科学省、経済産業省が創設した「数理・データサイエンス・AI教育プログラム認定制度」に賛同し、経済産業省の「MDASH SUPPORTERS」の協力企業として大学などの教育プログラムの開発、実施の際に事業課題やデータの提供、指導員の派遣を行うと発表した。

「数理・データサイエンス・AI教育プログラム認定制度」は、内閣府、文部科学省、経済産業省が連携して、これらの分野の教育を奨励するための認定制度。大学院を除く大学、短期大学、高等専門学校の教育プログラムを認定し、支援するというもの。「MDASH SUPPORTERS」とは、「数理・データサイエンス・AI教育プログラム」を支援する賛同企業や団体のこと。富士通、ソフトバンク、NTT DATAなどの大手企業が名を連ねている。

アスクルでは、「MDASH SUPPORTERSとして、数理・統計学を学ばれた若い方々の力が社会で発揮され、日本の競争力が高まることを期待し、本プログラムに協力してまいります」と話している。

Google CloudがSparkのマネージドサービスを発表

Google(グーグル)は米国時間10月12日の同社Cloud Nextイベントで、フルマネージドサービスとして「Spark on Google Cloud」の提供を発表した。これにより、オープンソースの人気データプロセッシングエンジンをGoogle Cloud上のプレミアムなサービスとして利用できるようになる。

Googleのデータベース、アナリティクス、Looker担当バイスプレジデント兼ゼネラルマネージャーのGerrit Kazmaier(ゲリット・カッツマイヤー)氏は次のように述べた。「このイノベーションで、Sparkがついにクラウドネイティブの世界にやってきます。データエンジニアやデータサイエンティストは、クラスタエンドの構成を心配することなくSparkを扱えるようになります。しかもGoogle Cloudのあらゆるデータサービスとも統合しました。そのため、BigQueryやVertex AI、Dataplexから直接Sparkを使い始めることができます。このようにSparkを簡単に利用でき、お客様は使い慣れたフレームワークやツールキットを使えます。データサイエンスのエクスペリエンスを、これからはクラウドネイティブで活用できるのです」。

Googleは「Google Cloudデータプラットフォーム向けとして世界初の、オートスケーリングでサーバーレスのSparkサービス」と説明している。しかしSparkの人気を考えれば、Sparkの実行や管理を提供する企業はたくさんある。SparkはDatabricksプラットフォームの中心でもあるが、DatabricksはSparkの開発者が創業し、十分な資金を調達しているスタートアップであることを考えれば当然だろう。

あなたはこんなふうにも思うかもしれない。「Google Cloudには、Dataprocの一部としてマネージドのSparkサービスがすでにあるんじゃないの?」(もちろん、あなたがGoogle、Amazon、Microsoftのクラウドのすべてのサービスを覚えている20%のうちの1人ならば、ということだが)

しかしカッツマイヤー氏は筆者に対し、異なる顧客をターゲットにした別のサービスであると説明した。すでにSparkやHadoop、あるいはMapReduceやPrestoなどのシステムを構成して利用しているなら、 Dataprocはこれらすべてをマネージドサービスとして今後提供する。しかし同氏としては、Google Cloudのデータサービスに関して開発しているものはすべてシンプルであることが大切で、特にデータのジャーニーを始めたばかりの企業が簡単に利用できることを重視しているという。

同氏はこう語った。「データチームを編成しているときに、データエンジニアを1人、データサイエンティストを1人雇いますか?最初に『これからストレージシステムを構築します。メタデータのシステムをゼロから作るんです』なんて言いたいでしょうか?もちろんそうではないですよね。しかし現状では、実際にそうせざるを得ません。これからはサーバーレスのSparkがあります。『さあ、やろう』というだけです」。

画像クレジット:Aki Ikonen / EyeEm / Getty Images

原文へ

(文:Frederic Lardinois、翻訳:Kaori Koyama)

【コラム】データを重視する企業はAIと同じくらい人にも価値を置くべきである

編集部注:本稿の著者Asaf Cohen(アサフ・コーエン)氏は、データ運用プラットフォームであるMetrolink.aiの共同設立者兼CEO。

ーーー

「80:20のルール」としても知られるパレートの法則は、結果の8割は、原因全体の2割に相当する事柄に起因しているのであり、その他の原因が結果に及ぼす影響は小さいとする。

データ関連の仕事をしている人なら、この80:20のルールの別バージョン、すなわち、データサイエンティストは実際の分析やインサイトの生成ではなく、雑然としたデータを整えるのに勤務時間の80%を費やしている、というフレーズを耳にしたことがあるのではないだろうか。通常なら30分で行ける道のりを、交通渋滞のために2時間半かかるという例を考えれば、このフレーズの言わんとするところが理解していただけるだろう。

実際には、ほとんどのデータサイエンティストはデータ分析に勤務時間の20%以上の時間を割いているだろうが、それでも雑然とした大量のデータを分析に適したものに整えるのに数え切れないほどの時間を費やしているのが現状だ。重複したデータを削除したり、すべてのエントリが正しくフォーマットされていることを確認したりすることもこのプロセスの一部であり、その他の準備作業もしなければならない。

Anacondaの最新の調査によると、このプロセスに平均して全体の時間の45%が費やされていることがわかった。それより前に実施されたCrowdFlowerの調査では、その数字は60%と推定されており、またその他の調査でもこの範囲内の数字が示されている。

データの整備が重要でない、というわけではない。「使い物にならないデータを投入しても、使いものにならない結果が得られるだけ」とは、コンピューターサイエンス界でよく知られた法則であるが、これはデータサイエンスにも当てはまる。例えば、顧客番号1527のエントリーが数字ではなくテキスト形式になっていると、顧客あたりの平均支出を算出することができず、エラーになってしまうが、これはまだましな例である。最悪な場合には、企業は現実とは無関係なインサイトを元に今後に向けての判断を下すことになる。

ここで本当に問われるべきなのは、顧客番号1527のデータを、高給取りの専門家の時間を費やして再フォーマットするのが最良の方法なのかどうかである。さまざまな推定によると、データサイエンティストの平均給与は、年間で9万5000~12万ドル(約1050~1300万円)である。このような高給取りの従業員に、誰にでもできるようなつまらない雑用をさせるのは彼らの時間と会社のお金の無駄である。さらに、現実世界のデータには寿命があり、時間的制約のあるプロジェクトの場合、データセットの収集と処理に時間がかかりすぎると、分析を行う前に、それは古くて使いものにならなくなる可能性がある。

さらに、企業のデータの探求には、データに関与するはずではない人員が、本来の仕事ではなく、データの収集や生成の支援を命じられるなど、時間の無駄遣いが発生していることが少なくない。企業が収集したデータの半分以上はまったく活用されておらず、このことは、収集に関与した人員すべての時間が無駄に使われ、業務上の遅延とそれにともなう損失しか生み出さないことを示唆している。

データは収集されるものの、データサイエンスチームに負荷がかかりすぎてしまっていて、すべてのデータを活用できないこともしばしばだ。

すべてはデータのために、データはすべてのために

ここで概説された問題は、GoogleやFacebookなどのデータのパイオニアを除き、企業がデータ主導の時代における自らのあり方に頭を悩ませているという事実と結びついている。データが巨大なデータベースに投入され、データサイエンティストはデータ整備に多くの時間を費やし、またデータの収集の支援に時間を浪費している他の従業員がそのことから利益をえることはあまりないのである。

有り体に言えば、データ変革は始まったばかりである。データを事業モデルの中核に据えたテック大手の成功は、始まりの合図にすぎない。そして今のところその結果はまちまちであり、これは企業がまだデータに関する思考に習熟していないことの表れである。

データは多大な価値を持っており、企業もそれには気がついている。それは、 テック企業ではない企業がAI専門家を求めていることにも表れている。企業は道を誤ること無く進む必要があり、そこで重要になってくることの1つが、AIに注力するのと同じくらい人材に注力することである。

データは、事実上、あらゆる業種の組織構造内のあらゆる要素の運用を強化することができる。すべてのビジネスプロセスに機械学習モデルが存在する、といった未来を想像するのは魅力的かもしれないが、今はそこまで踏み込む必要はない。今日データを利用しようと考える企業のゴールは、データをA地点からB地点に移すことである。A地点はワークフローの中のデータが収集される地点であり、B地点は意思決定にそのデータを必要としている人物である。

重要なのは、Bがデータサイエンティストである必要はないということである。これは最適なワークフロー設計を解明しようとしているマネージャーかもしれないし、製造プロセスの欠陥を見つけ出そうとしているエンジニアかもしれないし、特定の機能のA/Bテストを行っているUIデザイナーかもしれない。これらの人々は全員、必要なデータを、インサイトを得るために処理できる状態で常に手元に持っていなければならない。

企業が人々に投資し、基礎的な分析スキルを身に付けさせた場合は特にそうだが、彼らはモデルと同様データで力を発揮することができる。このアプローチにおいては、アクセシビリティが鍵である。

懐疑論者はビッグデータは使い古された経済界の流行語にすぎないと主張するかもしれない。しかし、高度な分析能力は、明確な計画と適切な期待が備わっている限り、あらゆる企業の収益を強化することができる。最初の第一歩は、データをアクセスしやすく使いやすくすることであり、可能な限りデータを取り込むことではないのである。

言い換えれば、オールラウンドなデータ文化は、企業にとってデータインフラと同じくらい重要なのである。

関連記事
【コラム】データサイエンティストは恐れずに新しい分野に挑戦せよ
データサイエンティストが社内全体とデータを共有するプロセスをシンプルにするHexが6.1億円調達
データ活用支援のDATAFLUCTが3億円調達、スタートアップスタジオモデルで2年後の上場目指す
画像クレジット:Getty Images under a alphaspirit license.

原文へ

(文:Asaf Cohen、翻訳:Dragonfly)

【コラム】データサイエンティストは恐れずに新しい分野に挑戦せよ

編集部注:本稿の執筆者Ilyes Kacher(イリエス・カーシャー)氏は、商品画像をオンラインで一括編集するAIベースのプラットフォーム、autoRetouch(オートレタッチ)のデータサイエンティスト。

ーーー

私はフランス出身のデータサイエンティストで、コンピュータービジョンの研究技師としての経験を日本で積んだ後、母国に戻った。しかし今、私はコンピュータービジョンのハブとは思えないドイツのシュツットガルトでこれを書いている。

ただし、みなさんが想像するであろうドイツの自動車技術の仕事をしているのではない。代わりに、パンデミック下の驚きべきチャンスを最もありそうもない場所で私は見つけた。そこはシュツットガルトのeコマースに特化したAI駆動の画像編集スタートアップで、あらゆる小売製品のデジタルイメージングプロセスを自動化している。

日本での経験は、仕事で海外に移住することの難しさを私に教えた。日本では、プロフェッショナルネットワークとの接点を持つことが往々にして必要だ。しかしここヨーロッパでは、多くの都市にアクセスできることが利点だ。パリ、ロンドン、ベルリンなどの都市は、特定技術のハブとして知られていると同時に、多様な雇用機会を提供している。

パンデミックのために完全リモートワークが増加している中、職探しの範囲を広げることで、興味にあう機会がより多く提供される。

意外な分野で価値を見つける、たとえば小売業

私は今、高級小売業からスピンオフしたテック企業で、自分の専門技術を製品画像に応用している。データサイエンティストの視点からアプローチすることで、私は小売業のように巨大で確立した業界への新たな応用に価値を認識見出した。

ヨーロッパには世界的に有名なブランドがいくつもあり、中でもアパレルと靴が代表的だ。その豊かな経験が、数十億の製品と数兆ドル(数百兆円)の市場にイメージング技術を応用するチャンスを生み出している。小売企業の利点は、定常的に画像を処理することで、AI企業が収益を上げ、利益を上げる可能性もあるベースを作ってくれていることだ。

もう1つ、探求すべき分野として、研究開発部門の一部にあることの多い独立部門がある。私は相当数のAIスタートアップが、非常にニッチなクライアントの研究コストとその結果得られる収益のために利益を上げていない分野に取り組んでいるところを見てきた。

データを持っている企業は収益見込みのある企業

私が特にこのスタートアップに惹かれたのは、そのデータアクセスの可能性だった。データはそれ自体非常に高価であり、多くの企業は限られたデータしか利用できない。B2BやB2Cレベル、中でも小売業やフロントエンドのユーザーインターフェースに関わるデジタルプラットフォームと直接つながりのある企業は狙いどころだ。

こうした顧客エンゲージメントデータを活用することは全員の利益になる。将来の研究開発や分野内のその他のソリューションに応用できる他、自社の他部門と協力して弱点を解決することにも使える。

さらにこれは、ブランドが影響を与えるユーザーの関連分野への関心が高ければ高いほど収益の可能性が大きくなることを意味している。私からのアドバイスは、データがすでに管理可能なシステムに保存され、アクセスが容易な企業を探すことだ。そういうシステムは研究開発に有用だ。

難しいのは、多くの企業がそういうシステムを導入していないこと、あるいはシステムを活用できるスキルを持つ人がいないことだ。もし、深い洞察を語れなかったり、システムが未導入の会社があったら、データ活用の方法を導入するチャンスを探してみて欲しい。

ヨーロッパでは最善策には自動化プロセスの開発が関わっている

私は、プロセスとコアシステムを作るチャンスをくれるアーリーステージ企業の成功の秘訣を知っている。私が働いていた会社は、入社当時まだ新しく、ある分野のためにスケーラブルなテクノロジーを開発する仕事をしていた。チームが解決すべき課題はすでに解決していたが、山ほどあるその他の問題を解決するために行うべきプロセスはたくさんあった。

1年に渡る大量一括画像編集を自動化するプロジェクトは、開発しているAIが、同時に複数の可変要素(複数の画像とワークフロー)を横断して独立に動くことように作られていれば、既存の有名ブランドには出来ないことをするテクノロジーだということを教えてくれた。ヨーロッパでこれを実行している企業はほとんどないため、それができる人材は切望されている。

というわけで、ちょっとしたカルチャーショックを恐れることなく、飛び込んでみてはいかがだろうか?

関連記事
コンピュータビジョンとAIで服のフィット感をより正確に見られる仮想試着室「Revery.ai」
ロボット、チップ、完全自動運転、イーロン・マスク氏のTesla AI Dayハイライト5選
インテルが3D深度カメラ「RealSense」事業を閉鎖へ、コア事業に注力の戦略
画像クレジット:Warit Silpsrikul/EyeEm / Getty Images

原文へ

(文:Ilyes Kacher、翻訳:Nob Takahashi / facebook

データ活用支援のDATAFLUCTが3億円調達、スタートアップスタジオモデルで2年後の上場目指す

「多くの企業は、データを会社の中で腐らせてしまっています」。そう話すのは、データサイエンスビジネスを展開するDATAFLUCT(データフラクト)CEOの久米村隼人氏だ。同社は2021年4月20日、東京大学エッジキャピタルパートナーズよりシリーズAで3億円の資金調達を行ったと発表した。

埋もれているデータに「価値」を与える

DATAFLUCTは、企業がもつデータを最大限に活用するためのさまざまなサービスを提供している。企業に「埋もれているデータ」と、同社が保有する外部データや機械学習アルゴリズムを組み合わせることで、新しいインサイトを創造する。

同社が提供するサービスの1つは、大型スーパーの新規出店候補地を探すサポートだ。これは、クライアントであるスーパーの過去の出店履歴や売上データなどを取得し、立地条件を当てはめるという手法をとる。例えば、駅からの距離・フロアの面積・周辺エリアの人流・近隣にある学校や企業など、200から300ポイントにおよぶデータをAIに学習させる。これにより「○○の条件下では売上は○○」といった推測を行い、新規出店の場所を決定していく。

画像クレジット:DATAFLUCT

久米村氏は「もちろん、実際に出店してみないことには正確な売上げはわかりません。例えば、周辺に橋があると人の流れが大きく変わったり、ライバル店の商圏に影響されたりなど、科学できない部分はある。でも私達が大切にしているのは、『ダメな選択肢を削る』ということです。仮に毎月100件の物件を検討するときに、そもそも商機がないところをあらかじめ除外できるサービスは、企業にとって非常に大きいインパクトをもたらします」という。

同社の事業領域は、不動産にとどとどまらない。メディア企業向けに「さまざまな媒体での広告出稿の効果」をクリック1つでビジュアル化するツール。食品メーカー向けに「油を変える最適なタイミング」を示すツール。物流会社向けには「最も効率よく配送を完了できる道順」を示すツールなど、多岐にわたる業界にDXソリューションを提供している。

同時多発的にプロダクトをローンチ

しかし「データを活用したDXソリューション」は、DATAFLUCTが展開する事業のほんの一部にすぎない。同社は創業から約18カ月間でモビリティ、スマートシティ、EdTech、スマートグリッド関連など13プロダクト(SaaS)を矢継ぎ早にローンチ。これは、同社が各ユニットに独立採算制を採用するスタートアップスタジオだからこそ実現した。一方で「JAXA認定ベンチャー」としての顔も持ち、衛星データ解析を活用したSDGs事業を意欲的に行う。久米村氏自身も「うちは常識から逸脱していることが多すぎて、VCにも理解されにくい」と苦笑いだ。

それにしても「なぜさまざまな業界に同時に参入する必要があるのか?」と思われる読者がいるかもしれない。久米村氏はこう説明する。「私達のサービスは、そもそも社会課題を解決するという出発点から始まっています。例えば、食品廃棄ロス問題を解決したいとすると、生産者(農家)、製造業、卸売、スーパーなど、サプライチェーン上のすべての課題を解決する必要がある。私達は、これらをデータで統合することで解決に導きたいと考えています。例えば、衛星データを活用した野菜の収穫支援から、店舗での需要予測アルゴリズム、ダイナミックプライシングの導入まで、包括的にデータを活用することでサプライチェーンの効率化を実現したい。そのために、これまで同時多発的にプロダクトをローンチし、全領域を攻めてきました」。

データ活用を通じて社会の変革を目指す

DATAFLUCTのCEOである久米村氏は、これまでベネッセコーポレーション、リクルートマーケティングパートナーズ、日本経済新聞社などを渡り歩き、データ分析を活用した新規事業開発を主にてがけてきた。「私自身、DXコンサルで約70業界に携わり、立ち上げた新規事業は30を超えます。物流のことを聞かれてもおおよそわかるし、ヘルスケアのことを聞かれてもおおよそわかる。顧客が言ったことに対して、すぐに打ち返せるパワーが強みだと思っています」。

独立のきっかけは、同氏が会社員時代に持っていた不満だった。「ハッキリいうと、コンサル会社に金を払いすぎていると思ったのです。彼らの働きを見て『自分だったらもっとうまくできるのではないか』と」。それでも独立後は、新型コロナウイルスの影響により、リアル店舗を対象とした初期のプロダクトから一時撤退を余儀なくされた。しかし、データ活用のニーズを持つ多様な業種の企業から声がかかり、DXソリューションの提供へとピボットしていくうちに事業が軌道に乗った。

今回調達した3億円の主な使途は人材採用だ。久米村氏は「2年後の上場を目指しています。でも2年だとできることは少ない。お金稼ぎはできるかもしれないが、社会の変革はできない。5年先、10年先にはじめてDATAFLUCTの価値がでてくるのかな、と考えています」と話す。

「21世紀の石油」ともいわれるデータ。もし今後、多くの企業が社内に眠ったままだったデータの価値を掘り起こすことができるようになれば、DATAFLUCTが目指す社会課題の解決も夢物語ではなくなるだろう。

関連記事:DATAFLUCTがビッグデータを活用した青果物サプライチェーンの垂直統合・DXを支援するサービスを開始

カテゴリー:人工知能・AI
タグ:DATAFLUCTデータサイエンス東京大学エッジキャピタルパートナーズ資金調達DX日本

画像クレジット:DATAFLUCT

データサイエンティストが社内全体とデータを共有するプロセスをシンプルにするHexが6.1億円調達

企業がデータの活用を推進し、データサイエンティストを増員する一方で、そのデータの共有することには障害がつきまとう。コピー&ペーストや手作業が多すぎるのだ。新しいスタートアップ企業のHexは、合理的でエレガントな方法で社内全体にデータを分配する方法を提供することにより、この状況を変えたいと考えている。

米国時間3月31日、Hexはシード投資550万ドル(約6億1000万円)を調達したニュースとともに、この製品を限定的なベータ版からより広く一般に公開すると発表した。このラウンドはAmplify Partnersがリードし、Box Group、XYZ、Data Community Fund、Operator Collective、およびさまざまな個人投資家が支援した。同社は2020年7月にこのラウンドをクローズしたが、今回初めて公表した。

共同創業者兼CEOのBarry McCardel(バリー・マックカーデル)氏は、企業がよりデータドリブンになり、データサイエンティストやアナリストを急ピッチで採用していることは明らかだが、データの共有をめぐる問題があり、それは彼と共同創業者たちがPalantirで働いていたときに身をもって体験したことだと語った。

そこで彼らは、データセットを扱うデータサイエンスチームに比べると分析的・技術的な知識が少ない組織内の他部門とデータを共有するための専用ツールを開発することにした。「当社は、データサイエンティストが自分たちのデータに接続し、ノートブックで分析し、研究することを非常に簡単にしました。【略】そしてその成果を、誰もが利用できるインタラクティブなデータアプリとして共有できるようにしました」とマックカーデル氏は説明してくれた。

データサイエンティストの多くは、Jupyterのようなオンラインノートブックでデータを扱い、SQLクエリを作成したり、Pythonコードを入力してデータを整理したり、グラフを作成する。Hexは、SnowflakeやAmazon Redshiftからデータセットを取り出し、簡単な方法でデータを操作してフォーマットし、チャートやデータセットなどのコンポーネントをノートブックのページからドラッグ&ドロップすることで、他の人と共有できるようなアプリを非常にすばやく構築することができる、スーパーチャージされたノートブックを開発しているのだ。

画像クレジット:Hex

このスタートアップは共同設立者のマックカーデル氏、CTOのCaitlin Colgrove(ケイトリン・コルグローブ)氏、アーキテクチャー担当VPのGlen Takahashi(グレン・タカハシ)氏を含む9名の社員で構成されている。「当社は早い段階からチーム作りに力を入れ、多様性のあるチームを作ることに努めてきました。今日、エンジニアリングチームの過半数が女性というのは、私にとって初めての経験です」とコルグローブ氏は語った。

彼女はまた、数少ない女性創業者の1人でもある。Silicon Valley Bank(SVB)が2020年に発表したレポートによると、女性創業者の数は増加の傾向にあるものの、米国のスタートアップ企業のうち女性創業者が少なくとも1人いるのは28%に過ぎない。それは、2017年の22%から上昇した。

Hexは2019年末に設立され、創業者たちは2020年の大部分を製品の構築とデザインパートナーとの共同作業に費やした。彼らは少数の有料顧客を抱えており、これからそれを拡大しようとしている。今のところ、顧客はHexチームと協力して作業を進める必要があるが、2021年後半には製品をセルフサービスで使えるようにすることを計画しているという。

Hexを早期に導入した企業には、Glossier(グロシエ)、imgur(イメージャー)、そして学費支援スタートアップのPaveなどが含まれる。

カテゴリー:ソフトウェア
タグ:Hex資金調達データサイエンス

画像クレジット:dowell / Getty Images

原文へ

(文:Ron Miller、翻訳:Aya Nakazato)

AIチームのトレーニングデータワークフロー「自動化」を支援するV7 Labsが3.1億円調達

AIの進歩に伴い、AIチームのトレーニングデータワークフローを「自動化」し、将来性を保証することを支援するコンピュータビジョンプラットフォームのメーカーであるV7 Labsは、300万ドル(約3.1億円)の資金調達を発表した。シードラウンドをリードするのはAmadeus Capital Partnersで、Partech、Nathan Benaich(ネイサン・ベナイチ)氏のAir Street Capital、Miele Ventureなどが参加している。

Singularity University(シンギュラリティ大学)の卒業生であるAlberto Rizzoli(アルベルト・リッツォーリ)氏とRSIの元R&Dリーダー、Simon Edwardsson(サイモン・エドワードソン)氏(「見る」視覚補完アプリAipoly(アイポリ)を開発した同じチーム)によって2018年に設立されたV7 Labsのプラットフォームは、高品質なトレーニングデータの作成を10~100倍に加速することを約束している。これは、自動化された画像・動画データパイプラインの構築、複雑なデータセットの整理とバージョン管理、「最先端 」の視覚AIモデルのトレーニングとデプロイメントを行う機能をユーザーに提供することで実現するという。

「企業がビジネス価値を提供するコンピュータビジョンソリューションを構築するためには、モデルを継続的に収集し、ラベル付けし、再訓練する必要があります。」とV7 Labsのリッツォーリ氏は説明する。「2015年にアイポリを構築した際には、サード・パーティ製のSaaS製品がなかったため、AIの急速な進歩に対応しつつ、独自のツールを構築・維持する必要がありました。」

現在まで話を進めると、リッツォーリ氏によれば、コンピュータビジョンのトップ企業の多くが、この問題を解決するためにV7のようなSaaSプラットフォームに目を向けているという。「AIスタートアップを構築する際には、考えなければならないことがたくさんありますが、『100種類のビデオデータセットを効率的に保存し、クエリーを行うにはどうすればよいか』ということは、サービスを提供しようとしている真っ最中にしか考えられないことです。」

「V7は、データの整理、ラベル付け、実世界の問題に対応したコンピュータビジョンモデルの立ち上げに関する業界のベストプラクティスを体系化しています。」とも。

Image Credits: V7 Labs

このブラウザ・クラウドベースのプラットフォームは、大規模な画像/動画データセットを「ラグなく」迅速にアップロードしてレンダリングし、事前のトレーニングデータを必要とせずに(程度の差はあれ)ラベル付けを自動化できると同社は主張している。V7はまた、画像/動画ごとに非常に多くのラベルを記録できるように設計されており、画像ごとに数千のアノテーションを、データセットごとに数百万の画像をサポートするとのこと。極めて重要な点として、「DevOpsの心配をすることなく、数クリックで」プラットフォーム内でコンピュータビジョンモデルのトレーニング、デプロイ、実行が可能であることをリッツォーリ氏は語った。

「クライアントは近い将来、これらのモデルとそれに対応するトレーニングセットを監査して、デバッグ、データ品質のテスト、失敗例の発見、不要なバイアスの排除を行うことができるようになるでしょう」と彼は付け加え、これらはすべて、AI業界がまだ解決していない大きな問題点であると指摘した。

それに向け、V7 Labsの既存の100社ほどの顧客には、Tractable(トラクタブル)、GEヘルスケア、米国メルクなどが含まれている。V7 Labsは医療用画像処理業界で最も急速に成長しているが、その理由の一つには、DICOMアノテーションとHIPAA(医療保険の携行と責任に関する法律)コンプライアンスをサポートしていることが挙げられる。

しかし、プラットフォーム上で処理されるデータ量で測ると、日常的な 「専門家による点検」が最も多く行われる作業であるとリッツォーリ氏は言う。「これらには、AIを使って自動車、石油リグ、送電線、パイプライン、道路などの損傷や異常を探す何十社もの企業が含まれています。」と彼は語った。

関連記事:合成データがスケーラビリティとセキュリティを解決する新しいビッグデータであることに着目するTonic

カテゴリー:人工知能・AI
タグ:データサイエンス 資金調達

[原文へ]

(翻訳:Dragonfly)

Tonicは合成データがスケーラビリティとセキュリティを解決する新しいビッグデータであることに着目

ビッグデータは表面的で中身が掴めない。何年も前から、あらゆる企業はある種のデータベースの中でデジタル情報の残滓をすべて保存しておくべきだと言われてきた。そうしないと、経営陣は競合他社などに対して競争力のあるインテリジェンスを失いかねない。

しかし、ビッグデータには1つ問題がある。とにかく膨大な量であることだ。

ペタバイト規模のデータを処理してビジネスに関する洞察を生成するには、コストと時間がかかる。さらに悪いことに、これらのデータは世界中のあらゆるハッカーグループのターゲットになる危険が大きい。ビッグデータは、維持、保護、機密保持すべてにコストがかかるが、押し並べてみると結果はそうしたコストに見合わない可能性がある。多くの場合、精選されたデータセットは、無限量の未処理データよりも速く、より良い洞察を提供できる。

企業は何をすべきだろうか?ここでまさに、Tonicがビッグデータの問題を改善するのに必要とされるだろう。

Tonicは「合成データ」プラットフォームで、未処理のデータをソフトウェアエンジニアやビジネスアナリストが使いやすいプライベートなデータセットに変換する。その過程でTonicのアルゴリズムは元のデータを識別せず、統計的には同一だが合成されたデータセットを作成する。これは個人情報が不安定なかたちで共有されないことを意味する。

たとえば、オンラインショッピングプラットフォームはその顧客と彼らが購入したものに関する取引履歴を持つ。そのデータを社内のすべてのエンジニアやアナリストと共有することは危険である。なぜなら、その購入履歴には知る必要のない者がアクセスすべきでない個人的な詳細情報が含まれている可能性があるからだ。Tonicは元の支払いデータを、まったく同じ統計的性質を持つが元の顧客とは結びつかない、新しい小さなデータセットに変換することができる。そうすればエンジニアがアプリをテストしたり、アナリストがマーケティングキャンペーンをテストしたりといったことがプライバシーに関する懸念を引き起こすことなく可能になる。

巨大なデータセットのプライバシーを扱う合成データやその他の方法が、ここ数か月の間、投資家から大きな注目を集めている。我々は先週、従業員が必要なデータのみにアクセスし、他のデータへアクセスすることをブロックするポリモーフィック型の暗号化への取り組みにラウンドを調達したSkyflowについて報じた。BigIDは、地域のプライバシー法に基づいてデータのある場所やアクセスすべき人物について追跡する(すなわちデータガバナンス)ことに留まらない包括的な視点を有している

Tonicのアプローチには、プライバシーの問題だけでなく、データセットのサイズが大きくなるにつれて生じるスケーラビリティの問題も解決できるという利点がある。この組み合わせは投資家の注目を集めている。Tonicは本日午前、GGVのGlenn Solomon(グレン・ソロモン)氏とOren Yunger(オレン・ヤンガー)氏が率いるシリーズAで800万ドル(約8億3000万円)を調達したことを発表した。

同社は創業者4人によって2018年に設立された。CEOのIan Coe(イアン・コウ)氏はCOOのKarl Hanson(カール・ハンソン)氏と中学時代に出会い、両氏とCTOのAndrew Colombi(アンドリュー・コロンビ)氏は共にPalantirで勤務した経験がある。コウ氏はまた同社のエンジニアリング責任者Adam Kamor(アダム・カーマー)氏と共にTableauで働いていた。シリコンバレーの成功している最大手のデータインフラ企業で培われたものは、Tonicの製品DNAの一部を形成している。

Tonicのチーム。写真はTonicより提供

コウ氏によると、Tonicは現代のソフトウェアエンジニアリングで発生する最も明白なセキュリティ上の欠陥のいくつかを防ぐように設計されているという。エンジニアリングチームがデータパイプライン処理に費やす時間を節約することに加え、Tonicは「機密データが本番環境から、本番システムよりも常に安全性の低い下位の環境に移動することを懸念していない」という。

Tonicが誕生するきっかけは、Palantirの銀行顧客のトラブルシューティングをしていたときだったという。彼らは問題を解決するためにデータを必要としていたが、そのデータは非常にセンシティブだったため、チームは合成データを利用することになった。コウ氏は、合成データの有用性をより厳密な方法でより多くの人々に拡大したいと考えている。「規制の圧力は、データの取り扱い慣行を変えることをチームに迫っていると思います」 と彼は言う。

Tonicのテクノロジーの鍵は、未処理データを評価し、すべてのレコード間の関係を統計的に定義するサブセッターにある。分析の一部はデータソースに応じて自動化されており、自動化できない場合にデータサイエンティストがデータセットをオンボードし、それらの関係を手動で定義することをTonicのUIは可能にする。最終的にTonicは、そのデータを所有する企業内のすべての人が使用できる合成データセットを生成する。

今回の資金調達でコウ氏は、使いやすさとオンボーディングをさらに強化し、顧客にこのモデルのメリットを広めたいと考えている。「私たちは様々な観点からカテゴリーを生成しています。それは人々が商品やサービスを早期に受け入れるアーリーアダプターの考え方とその価値を理解し身につける必要がある、ということを意味します」と彼は語る。

主要投資家のGGVに加えて、Bloomberg Beta、Xfund、Heavybit、Silicon Valley CISO Investments、そしてエンジェル投資家のAssaf Wand(アッサーフ・ワンド)氏とAnthony Goldbloom(アンソニー・ゴールドブルーム)氏がこのラウンドに参加している。

関連記事:イリノイ州がマスク着用啓発の広告費割り当てにデータサイエンスを活用

カテゴリー:セキュリティ
タグ:ビッグデータ データサイエンス

[原文へ]

(翻訳:Dragonfly)

イリノイ州がマスク着用啓発の広告費割り当てにデータサイエンスを活用

公衆衛生に役に立つターゲット広告の例がある。マスク着用を促すキャンペーンで、イリノイ州は新型コロナウイルス感染症のリスクが最も高い郡にデジタル広告費用を注いでいる。

これを実現するために、同州政府はDan Wagner(ダン・ワグナー)氏が設立した(未訳記事)データサイエンス企業Civis Analytics(シビス・アナリティクス)と協業してきた。ワグナー氏は以前、Barack Obama(バラク・オバマ)氏の2012年再選キャンペーンで最高アナリティクス責任者を務めた人物だ。デジタル広告キャンペーンは2020年8月に始まったが、同州はターゲットを絞るのに使っている週ごとのリスク評価を示すマップなど、この取り組みの詳細をいま明らかにしている(イリノイ州リリース)。

Civisでヘルスケアアナリティクスのディレクターを務めるCrystal Son(クリスタル・ソン)氏は、チームが郡レベルの最新の新型コロナウイルスデータをJ.B. Pritzker(J.B.プリツカー)知事のチームのために毎週まとめていると説明した。プリツカー知事はこのデータを、It Only Works If You Wear Itキャンペーン広告費をどこで重点的に使うべきかを決めるのに活用している。

知事のオフィスで管理・予算を担当する責任者Cameron Mock(キャメロン・モック)氏は「最も新型コロナリスクがあるエリアにメディア費用を集中させるための独自方式」を州政府は活用している、と声明文で述べた。

モック氏は「リスクを基にした独自方式は、郡を高リスク、中リスク、低リスクに分けるために新型コロナ新規患者の傾向と郡レベルのモビリティを活用しています。そしてリスクが最も高いエリアに最も多くの広告費を充てるために比例分配を採用しています」。

画像クレジット:State of Illinois

この独自方式では郡を5つに分ける。最もリスクの高い郡はティア1、最もリスクが低い郡はティア5だ。ティア4と5にはベーシックな広告費が配分され、ティア3の郡はより大きな額を受け取る。そしてティア1と2には最大額が分配される。

マスク着用キャンペーンはオンライン広告に限定されてはいないが、独自方式はデジタル面でのみ使われている。というのも、広告費を週単位で従来の広告チャンネルに振り分けるのは難しいからだ。

「各郡の新型コロナ状況はそれぞれ異なるため、我々はイリノイ州内102郡の各現場の状況に対応するキャンペーンになるようにデザインしました」とプリツカー知事の副報道官Alex Hanns(アレックス・ハンズ)氏は声明で述べた。「エリアのリスクが高まった時、公衆衛生に関するメッセージの頻度も増えます。パンデミックが続いて次の波が来るとき、イリノイ州は引き続き科学者の指摘に耳を傾け、住民の安全を守るためにデータを追跡します」。

ソン氏は新型コロナ対応で、最もリスクの高い地域への広告費投入を優先するのと同じようなモデルを使っているキャンペーンは他にはない、と話した。このモデルはうまくいっているのだろうか。特定のキャンペーンの効果はデータでは示されないが、カーネギーメロン大学によると、イリノイ州民の89%がマスクを着用していて、これは現在米国内で15番目に高いマスク着用率となっている。

将来は他の組織がヘルスケアのために「よりカスタマイズされたコミュニケーションアプローチ」を採用するようになることを願っています、とソン氏は述べた。

「各グループが同じように行動して考えるかのように、ヘルスケアにおいては各グループを同一扱いする習慣がまだあります。それぞれにカスタマイズされたアプローチは、マスク着用以外にも幅広く応用できます」と話した。

カテゴリー:パブリック / ダイバーシティ
タグ:データサイエンス新型コロナウイルス

画像クレジット:filadendron / Getty Images

原文へ

(翻訳:Mizoguchi

元GCHQのデータ科学者が設立したRipjarが金融犯罪を検知するAIに約39億円を調達

幅広い意味でサイバー犯罪に区分される金融犯罪には、詐欺、マネーロンダリング、テロへの資金供与といったさまざまな不正行為が含まれ、オンライン上の脅威の中で今なお最も影響力が大きい犯罪であり続けている。そのような犯罪に対抗すべくデータインテリジェンスのソリューションを構築してきたスタートアップの1つが本日、さらなる成長を遂げるための資金を調達したことを発表した。

英国の政府通信本部(GCHQ、米国のNSAに相当)で諜報業務に従事していた5人のデータ科学者によって設立された英国企業Ripjar(リップジャー)は、シリーズBで3680万ドル(約38億8000万円)を調達した。この資金は、AIプラットフォーム(Labyrinthと呼ばれる)のスコープと事業規模を拡大するのに充てられる予定だ。

リップジャーによると、Labyrinthは自然言語処理とAPIベースのプラットフォームを使用して構造化データと非構造化データの両方を処理するため、組織は分析したいデータソースをプラットフォームに組み込んでアクティビティを監視できる。Labyrinthは、制裁対象リスト、重要な公的地位にある者(PEP)、取引のアラートなどのデータソースを使用して、アクティビティをリアルタイムに自動でチェックする。

リップジャーに近い情報筋によると、今回の資金調達で、同社は1億2700万ドル(約134億円)の価値があると評価されているという。同社も、現在のところ利益を上げていることを認めている。

資金調達は、フィンテック専門の投資会社であるLong Ridge Equity Partners(ロング・リッジ・エクイティ・パートナーズ)が主導しており、以前の投資会社であるWinton Capital Ltd.(ウィントン・キャピタル株式会社)とAccenture plc(アクセンチュア)も参加している。リップジャーの戦略的パートナーであり、コンサルタント/システムインテグレーターであるアクセンチュアは、リップジャーのテクノロジーを使用して、金融サービス部門の多くの顧客と連携している。リップジャーは政府機関の顧客も抱えており、同社のプラットフォームはテロ対策にも使用されている。具体的な名前の公表は拒否されたが、数多いパートナーの中には、 PWC、BAE Systems(BAEシステムズ)、Dow Jones(ダウ・ジョーンズ)のような企業が含まれていることを同社も認めている。

リップジャーのCEO兼CTOであり、Tom Griffin(トム・グリフィン)氏、Leigh Jones(リー・ジョーンズ)氏、Robert Biggs(ロバート・ビッグス)氏、Jeremy Laycock(ジェレミー・レイコック)氏と同社を共同設立したJeremy Annis(ジェレミー・アニス)氏は次のように語る。「急成長中のソフトウェア企業が規模を拡大する際に専門知識とリソースを提供してくれるロング・リッジと提携できることを大変うれしく思っている。この投資は、世界をリードする当社のデータインテリジェンステクノロジーに対する大きな自信と、資産と繁栄を脅かす犯罪行為から企業と政府を守る当社の能力を示すものだ。今回の資金調達により、当社は世界展開を加速させ、顧客に最先端の金融犯罪ソリューションを提供するとともに、Labyrinthプラットフォームを新たなレベルに押し上げることができる」。

同社は、今年は今までで一番変化の大きい年だと言っている。状況から考えれば当然のことである。2020年は新型コロナウイルス感染症の世界的流行にともないオンライン取引への移行が大きく進んだだけでなく、世界経済の引き締めにより金融の混乱や新たな不正行為が増加したほか、この不安定な状況から利益を得ようとする犯罪行為も発生している。

これをうけてリップジャーは、6社の新規企業顧客と契約を締結し、4社の主要な既存顧客との取引を拡大した。現在では世界中に約2万の顧客を抱えているという。

筆者と同じように、読者の皆さんも「Ripjar(リップジャー)」という社名が気になっているかもしれない。この社名に意味があるとすれば、それは、同社の取り組みを暗に示唆するものに違いない。

しかし、広報担当者の説明によると「名前には何の意味もありません。これまでに使われたことのない名前を確実に選択するテクノロジーを使用して名前を付けたのです」とのことだった。

世界有数の金融センターの1つであるロンドンは、興味深いフィンテックスタートアップが生まれ育つ場所として高い評価を得ている。人工知能の分野でも有能な人材を輩出している英国は、フィンテックの保護に役立つサービスを構築するスタートアップにとって非常に豊かな土壌になっているということだ。

リップジャーが資金調達して規模を拡大したのは、詐欺や金融犯罪に対抗するためにAIを構築している他の2社が同じく資金調達し成長を遂げてから数か月以内のことだった。7月には、金融犯罪を食い止めることを目指してデータベースとプラットフォームを構築してきたComplyAdvantage(コンプライアドバンテージ)が5000万ドル(約52億8000万円)の資金調達を発表した。その1週間前には、金融犯罪やその他のサイバー犯罪を検知するためのAIを構築している別の英企業Quantexa(クアンテクサ)が6470万ドル(約68億3000万円)を調達している。

リップジャーは、Palantir(パランティア)のような業界大手だけでなく、この2社のことも競合相手だと考えている。ほとんどの場合、金融犯罪に取り組んでいる大企業は、複数の企業のテクノロジーを同時に使用している。

リップジャーは、より高度なアプローチを取っていると主張している。同社のインテリジェンス部門のディレクターであるDavid Balson(デビッド・バルソン)氏は、競合他社に関する筆者の質問に答えて次のように述べた。「Labyrinthは市場で最も先進的なソリューションであると確信しています。何十年にもわたり国家安全保障局内で犯罪やテロと戦ってきた経験を経て、Labyrinthを開発したからです。犯罪との闘いに特効薬はありません。そのため金融部門や法執行機関で行われている重要な仕事の効率性と有効性を強化するために、何百もの新しい技術を考え出さなければなりませんでした。このような新しい技術には、世界をリードする自然言語処理(NLP)や身元分析機能が含まれています。これらの機能はグローバルな言語とスクリプト上で機能し、構造化データと非構造化テキスト(ドキュメント、ニュースレポート、Webページ、インテリジェンスレポートなど)の間の点を自動的に結びます。これは、この分野でよく見られる情報過多の問題をアナリストが克服するのに不可欠な手段です」。

確かに、単体で特効薬になれないのはリップジャーのテクノロジーだけではない。マネーロンダリングの問題だけでも2兆ドル(約211兆円)の規模があるため(そのうち犯人を特定して、損失を取り戻したものは1~2%のみ)、少なくとも現時点では、銀行や政府などがこの問題に取り組むために複数のリソースを投入するのをいとわないのも当然だ。

ロング・リッジのマネージングパートナーKevin Bhatt(ケビン・バット)氏はある声明の中で次のように述べている。「金融機関、企業、政府機関は、金融犯罪やサイバー脅威にかかわるリスクの増大に直面している。我々は、リップジャーが、自動化によって新たな脅威を発見しつつコンプライアンスにかかるコストを削減できるような人工知能ソリューションを提供できる有利な立場にあると確信している。また、継続的な成長をサポートするために同社とパートナーを組むことができて非常にうれしく思っており、同社のチームと密接に連携し、新しい地域、顧客、垂直市場への拡大を支援することを楽しみにしている」。

関連記事:時代遅れの採用選考プロセスを嫌うデータサイエンティスト、コロナ禍の影響も?

カテゴリー:人工知能・AI

タグ:データサイエンス 資金調達 イギリス

[原文へ]

(翻訳:Dragonfly)