データサイエンティストを対象とした専用データベースのPineconeが34億円調達

Pinecone(パインコーン)が2021年の創業時に発したメッセージは、データサイエンティストのニーズに特化したサーバーレスベクターデータベースを開発するというものだった。このデータベースは同社が行っていることの中核を成すものだが、同社はAI駆動型検索を中心に、より洗練されたデータベースの用途へと向かっている。「干し草の山の中から針を見つける」データサイエンティストを支援することを目指している。

Pineconeの創業者でCEOのEdo Liberty(エド・リバティ)氏に2021年、1000万ドル(約12億円)のシードラウンドの際に話を聞いたときはちょうど、同社がデータベースを開発しながらその道を歩んでいるところだった。同氏はAmazon(アマゾン)で、SageMakerというデータベースサービスの構築に携わっていた。それからがずいぶん長い道のりだったと同氏は話した。

「シードラウンドの発表から、いろいろと変化がありました。まず何よりも10月にきちんとした有料サービス製品を立ち上げました。それ以来、採用数も収益も急増しており、本当に順調です」とリバティ氏は語る。

シードラウンドの際、データサイエンティスト向けの専用データベースを用意した理由をこう説明した。

機械学習モデルが期待するデータは、JSONレコードではなく、高次元ベクトルなのです。それは特徴のリストか、エンベッディングと呼ばれる、この世に存在するアイテムやオブジェクトの数値表現です。この形式は、機械学習におけるセマンティックの観点で、豊かで実用的なものです。

現在では、この意味優先のアプローチが顧客にPineconeを利用してもらえる原動力になっているという。「ベクトルデータベースの主な用途は検索で、しかも広い意味での検索です。ドキュメントを検索するわけですが、ここでは検索を、情報入手全般、ディスカバリー、レコメンデーション、異常検知などと考えることができます」と語った。

システムは、Pineconeデータベースのデータを処理するために設計されたリソースのセットである「ポッド」で構成されている。同社は、顧客が製品に慣れ、簡単な概念実証を行うために、1つのポッドを無償で提供している。その後、ポッドの数に応じて支払いを開始する。

リバティ氏は、同社が数十億個のオブジェクトに拡張できるよう設計したシステムに自信を持っている。「ソフトウェアが実用に耐え、実際にオーケストレーションできる範囲まで拡張することができるのです。私たちは、インデックスを作成して使用できるデータ量に明確な制限がないようにシステムを設計しました」と同氏は説明した。

サーバーレスデータベースであるため、顧客はプロビジョニングについて心配する必要はないが、処理を要するデータ量に応じて、毎月いくら使えるかをPineconeに伝える必要がある。

「ざっくりとした計算に基づき、データ容量と性能の点から、こういう用途にはXポッドで十分だろうという判断が下され、それで完了です」。後はサインアップして、コンソールを数回クリックし、APIを呼び出してインデックスを作成するだけで、すぐに使えるようになる。

リバティ氏は、成長率や従業員数を明かしたくないとのことだったが、2023年にはスタッフ(それがどういう意味であれ)が2倍になる見込みだという。注目すべきは、シード発表時の同社の従業員数は10人だったことだ。

多様性に関して同氏は2021年「リクルーターには積極的に動き(より多様な応募者を見つけるために)、すばらしい候補者を逃さないように、そして多様な候補者を連れてくるように指示しました」と話した。実際には、その結果、2022年の新規技術職採用者の(従業員総数の)50%は女性だという。

同社は米国時間3月29日、2800万ドル(約34億円)のシリーズAを発表した。Menlo Venturesがリードし、新規投資家からTiger Globalが、また既存投資家から同社のシードラウンドをリードしたWing Venture Capitalなどが参加した。これにより、同社は累計3800万ドル(約46億円)を調達したことになる。

画像クレジット:SAND555 / Getty Images

原文へ

(文:Ron Miller、翻訳:Nariko Mizoguchi

どんどん増える画像や動画に特化したデータベースを開発するApertureDataが約3.5億円のシード資金を調達

Vishakha Gupta(ビシャカ・グプタ)氏と、後に共同創業者になるLuis Remis(ルイス・レミス)氏は2016年にIntel Labsでともに働いていた頃、どんどん増えるビジュアルデータ(画像やビデオ)をどう管理するかを解決する業務を任されていた。2人はこの問題に精力的に取り組み、研究者やデータサイエンティストとも協力して、大量のビジュアルデータに適したインフラの開発を始めた。

結局、画像を扱い、データサイエンティストが利用する要件を満たす新しいデータベースが必要であるとの結論に達した。データサイエンティストは画像データを処理するために複数のシステムを扱う必要があり、これは非効率で時間がかかることがわかった。2人はもっと良い方法があるはずだと考え、Intelにまだ在籍していた2017年に、1カ所であらゆる処理ができるデータベースを構築するためのシステムに取り組み始めた。

2人はこの仕事がスタートアップになる素地を備えていると考え、2018年にIntelを退社してApertureDataという企業を始めた。正式に創業したのは2018年後半で、現在も引き続きこの問題に取り組んでいる。

最終的に開発したソリューションはApertureDBという名前のクラウドアグノスティック(特定のシステムに依存しない)データベースで、画像を処理することに関連するあらゆるデータ(メタデータなど)を1カ所で扱うことに特化して設計され、自動化することで手作業でデータを検討する時間のかかるステップを省くことができる。

グプタ氏は「もし私がデータサイエンティストで、データを見て何が起きているかを把握する立場だとしたら、データの検討に(相当長い)時間を費やさなくてはならないでしょう。(これまでは)このようなタイプのデータやこのようなタイプのユーザーを理解できるデータベースがなかったからです」と説明する。

さらに同氏はこう続ける。「それがこの問題を解決しようとするきっかけになりました。私と共同創業者はIntelにいたときにこの問題に直面していました。そして自分たちのためにこの問題を解決するのであれば、このインフラを構築している間にどうすればもっと多くの人のためにこの問題を解決できるかを探ろうと考えました。その結果としてApertureDataを創業し、ApertureDBをプロダクトとして提供することになりました」。

同社の従業員数は現在8人で、2022年末までに15〜20人にすることを目指している。グプタ氏は、女性創業者として多様性のあるチームを構築することの重要性を、そして2人の子を持つ母としてワークライフバランスの重要性も強く認識している。

同氏は「スタートアップで働くなら私的な部分は犠牲にしなくてはいけないというシリコンバレーの古い考え方があることをご存じでしょう。(私たちの考えでは)実はバランスをとることもできるし、多様性も実現できます。最初から多様であることが重要です」と述べた。

米国時間2月8日、ApertureDataはプロダクト開発を継続するための300万ドル(約3億4500万円)のシード資金調達を発表した。このラウンドを主導したのはRoot Venturesで、他にWork-Bench、2048 VC、Graph Ventures、Alumni Ventures Group、Magic Fundと、業界のエンジェルも参加した。

このラウンドがクローズしたのは2021年10月だった。それ以前は、全米科学財団の助成金、友人や家族からの資金、そして昔ながらのブートストラップでプロダクトを開発していた。

画像クレジット:Dimitri Otis / Getty Images

原文へ

(文:Ron Miller、翻訳:Kaori Koyama)

AWSがクラウド上のデータベースの問題を診断・修正する新ツールを発表

米国時間12月1日、AWSがユーザーがリレーショナル・データベース(関係データベース)の問題を容易に検出、診断、そして解決できるためのサービスを発表した。「DevOps Guru for RDS」というサービスは、AWSの完全な管理をともなうマネージド関係データベースプラットフォームであり、2020年、機械学習サービスの問題を検出するためにローンチしたDevOps Guru系列の一環だ。

Amazon AIの副社長であるSwami Sivasubramanian(スワミナ・サンシバスブラマニアン)氏が発表で、は多くの企業にとってデータベースの管理が優れていることが差別化要因にならないため、クラウドのマネージドサービスに下駄を預ける企業が多くなっていると述べた。しかしながら、そうであっても顧客たちはこれらのサービスを管理するためのより多くの自動化ツールを依然として求めている。特に要望が多いのは、パフォーマンスの診断の部分だとサンシバスブラマニアン氏はいう。

画像クレジット:TechCrunch

「いっそのこと、データベースに問題が起きたらアラートが鳴り、明確なガイダンスがもらえるようにしたらどうだろう?このままだとデータベースがロックしてユーザーのeコマースサイトが遅くなるという警告がもらえたらよいのではないか?原因となっている不正なSQLの文を教えてくれたら?」とサンシバスブラマニアン氏はいう。

DevOps Guru for RDSはそんなユーザーを助けて、彼らが、何らかの理由でパフォーマンスメトリクスがスパイクしたときの問題を検出できるようにする。このサービスは、データベースの中で生じているアクティビティを見て、異常を警告する。そしておそらくもっとも重要なのは、原因を分析して、変更方針を推奨してくれることだ。今後は、可能な場合には自動的に問題を修復してくれるだろう。

関連記事:AWSが運用上の問題を自動的に発見するDevOps Guruを発表

画像クレジット:TechCrunch

原文へ

(文:Frederic Lardinois、翻訳:Hiroshi Iwatani)

Cockroach Labsがサーバーレス版SQLデータベースを発表

米国時間10月19日、CockroachDB(コックローチDB)を開発しているCockroach Labs(コックローチ・ラボ)が、開発中のSQLデータベースの新しいサーバーレスバージョンのパブリックベータ版を発表した。これにより、開発者は明示的に定義することなく、スケールアップ / ダウンするデータベースリソースを簡単に使えるようになる。

共同創業者でCEOのSpencer Kimball(スペンサー・キンボール)氏は、その目標は開発者の複雑さを軽減すると同時に、きめ細かな価格体系を提供することだとしつつ、次のように述べている。「(サーバーレス製品は)開発者たちの事前の決定事項を減らします。これはとても重要なことです。しかし、もう1つの大きなメリットは、きめ細かな使用量に応じた課金が可能になり、使用した分だけ請求されるようになることです」。

データベースに対するサーバーレスのアプローチが重要な点は、開発者が行うキャパシティプランニングやそれに関連するすべての作業が不要になるところだ。つまり、アプリケーションを実行するために必要なノード数やマシンタイプを予測する必要がなくなるということだ。その代わりに、Cockroachのサーバーレスデータベースを指定するだけで、ワークロードを実行するために必要なだけの量のリソースを提供してもらえる。ワークロードが必要としないときには、1つのノードを完全に使うことさえしないかもしれない。

この動作にはリソースの共有も含まれているが、個別のデータはバックエンドで常に隔離されているとキンボール氏は指摘する。「実データが暗号化されていない重要な部分は、個別の開発者やユースケースから完全に隔離されています。このように隔離は行われつつも、バックエンドではデータの保存と検索のためのタスクが多数のマシンで共有されており、リソースを効率的に利用することができるようになっています」と彼はいう。

そして、このようにリソースを効率的に共有することで、開発者がアプリケーションを構築する際に、実際に軌道に乗るまではお金を払わなくてもよいような、寛大な無料プランを提供できるようになったという。さらに、ワークロードが急増した場合には、必要に応じてリソースを自動的に増減させることが可能だ。また、容量管理を自動化する際の重要なポイントだが、リソースの使用量が支払い能力を上回らないように制限をかけることができる。

キンボール氏によれば、無料プラン版から有料プラン版に移行するまではクレジットカードの提示は求めないので、アプリケーションが急激に成長を始めても請求書に驚くことはないという。彼は無料プランを「寛大」と表現しているが、価格プランの正確な詳細はまだ検討中だ。

このサーバーレス製品は、米国時間10月19日よりパブリックベータ版の提供が始まる。

Cockroach Labsは2015年に創業された。Crunchbaseのデータによると、これまでに3億5500万ドル(約405億5000万円)以上を調達している。直近の資金調達は、1月に20億ドルの評価額で行われた1億6000万ドル(約182億8000万円)のシリーズEだ。

画像クレジット:onurdongel/Getty Images

原文へ

(文:Ron Miller、翻訳:sako)

サーバーレスアプリケーションのためのAPIベースのデータベースサービスを提供するXata

Xataをご紹介しよう。同社は、これまでにない新しい角度からマネージドデータベースに取り組んだスタートアップだ。同社はあなたのデータベースをあなたに代わって動かし、それをAPIに変えるので、データベースのクエリやアップデートをサーバーレスのアプリケーションから行える。Xataはこの度、500万ドル(約5億5000万円)の資金を調達した。プロダクトはまだ十分に成熟していないが、同社はその詳細をすでにシェアしている。

XataはJamstackのウェブサイトに特に合ってるように思われる。Jamstackは、大規模なウェブサイトを開発しデプロイするための方法として、よく使われてきた。よく知られているJamstackのホスティングプラットフォームは、NetlifyVercelそしてCloudflare Pagesなどだ。

アプリケーションはグローバルなエッジネットワーク上にデプロイされ、ロジックはもっぱらAPI呼び出しが扱う。その結果ウェブサイトないしウェブアプリケーションはロードが速くて大量のトラフィックを扱える。

JamstackのウェブサイトはGitのリポジトリとタイトに統合されていることが多いため、デプロイがとても簡単だ。コードの変更をコミットしたら、サーバーレスのプラットフォームがアプリケーションのデプロイをやってくれる。APIベースのデベロッパーツールの統合は比較的楽だし、ロジックを自分で管理しなくてもよい。

たとえば静的なコンテンツとStripeのチェックアウトモジュールのあるウェブサイトをデプロイするなら、決済のサーバーはあなたに代わってStripeが管理する。しかしそこに、ライブのデータベースとそれとの対話が加わると、複雑な仕事になる。従来的なデータベースは、行を1行加えるだけでもインターネット上でAPI呼び出しに頼ろうとしない。複数の行を探索してデータを見つけるなら、なおさらだ。

Xataはデータベースに注力して、データベースをユーザーのサーバーレスアプリケーションに容易に統合できるようにしたい。データベースのスケーリングもXataが行うため、ユーザーはインフラストラクチャーを気にする必要がない。ソフトウェアのアップデートや、新しいサーバーへのデータの移動なども同じくだ。

データベースは通常、応答時間を速くして冗長性を持たせるために複数のデータセンターに分散している。画像も含めて、サポートするデータ型はとても多い。それでいてXataでは、データベースとの対話はまるでそこらのRESTful APIのようにに行われる。

同社はまた、Airtableのようなよく使われているノーコードのスタートアップからもヒントを得ている。データベースをウェブブラウザの中で開いて、データとの対話は直接そこから行なう。例えばカレントビューをフィルターし、特定の基準でデータをソートし、そして自分のコードで使えるAPIのクエリを得る。

データベースに大量のデータがあるなら、それらをフリーテキスト(無定型な自由文)検索機能で検索できる。また、Xataをアナリティクスに使ってチャートや視覚化を作ることもできる。

ウェブブラウザからデータと対話できる能力が、Xataの強みだ。今は、新しいプロジェクトのプロトタイプを作るときに、最初のバックエンドとしてAirtableに頼る企業が多い。しかしXataはそういうAirtableアズアバックエンド型のデータ管理モデルで、プロダクション(本番)にも対応したバージョンになれる。

500万ドルのラウンドはIndex Venturesがリードした。Operator CollectiveとSV Angel、そしてX-Factorのfirstminute Capitalが参加した。また当業界のエンジェルとして、ElasticのShay Banon氏とUri Boness氏、ConfluentのNeha Narkhede氏、VercelのGuillermo Rauch氏、 Color GenomicsのElad Gil氏、NetlifyのChristian Bach氏とMathias Biilmann氏が投資した。

同社の創業者はMonica Sarbu(モニカ・サルブ)氏だ。彼女はElasticのエンジニアリングのディレクターだったため、データベースのスケーリングについては詳しいはずだ。

画像クレジット:Xata

画像クレジット:Susan Q Yin/Unsplash

原文へ

(文:Romain Dillet、翻訳:Hiroshi Iwatani)

RDBをノーコード化して人気上昇のAirtableが初めての買収でデータ視覚化のBayesを獲得

ノーコードのリレーショナル・データベースを作っているAirtableが今日(米国時間8/11)、同社の初めての買収として、アーリーステージの視覚化スタートアップBayesを獲得することを発表した。買収の目的は、Airtableの上でデータをもっと視覚化できるようにすることだ。両社は、買収の価額を公表していない。

Airtableと同じく、Bayesもノーコードを重視しているので、両社は共に、かつては専門の技術者を必要とした仕事を単純化する、というビジョンを共有している。AirtableのCEOで共同創業者のHowie Liu氏によると、買収を考えていたわけでないが、そんな機会がたまたまやってきてしかも、そのチームとプロダクトがAirtableのノーコードという考え方に沿うものだった、という。

Liu氏は曰く、「チームとプロダクトに一目惚れした。それは、データの視覚化を面白くてユーザーフレンドリーなものにするというビジョンに貫かれていて、これならうちでも使える、と直感した。そんなデザイン思考はAirtableのプロダクトにも合うものであり、顧客が前よりもずっと良いデータの視覚化をできるようになる」。

Bayesの4人の社員はAirtableに加わり、数か月後には製品を閉鎖し、その機能性をAirtableに合体させるつもりだ。

関連記事: Don’t hate on low-code and no-code(未訳、有料記事)

Bayesの共同創業者であるWill Strimling氏によると、彼のスタートアップはAirtableとの相性がとても良い。そもそも2019年にBayesを創業したときも、Airtableが大きなヒントになったのだ。そして実際に話を始めてみると、これは一緒になった方が良い、という気になってきた。「お互いのロードマップや将来計画を突き合わせてみると、これは一緒にやった方が両社の単なる和以上のものになれる、と直観した。ユーザーにとっては、Airtableから得られる情報がより濃くなるし、レポート機能はワークフローの管理をずっと充実するだろう、と感じられた」、とStrimling氏は言っている。

Airtableは、現状のプロダクトでも若干の視覚化機能はあるが、しかしLiu氏によると、Bayesはやれることのレベルが違う。Bayesがあれば、Airtableのユーザーがその上に独自のインタフェイスを作れる。Liu氏はこう語る: 「データのグラフ化やリポート作成が、もっと高度なやり方でできる。Airtableの本当にカスタムなインタフェイスの作成能力を私たちの顧客に与えるために、投資をしてるんだ」。

Liu氏によると、これまでの同社は買収を考えるほどの大きさではなかったが、社員が500名になった今では、十分に大きいと感じられるし、今では役員たちにも買収を進める能力があるだろう。「自分の会社が小さいと思っている間は、買収という考え方はなかなか飲み込めないが、十分な規模に達したら、人材を取得してロードマップを加速するのも悪くない、と思えるようになる」、という。

Airtableは2013年に創業され、これまで6億ドルを調達している。最近のラウンドは2億7000万ドルのシリーズEで、評価額は57.7億ドルと大きかった。だから、買収へ向かうほどの財務的余裕もあった、と言える。近い将来、もっと買収を検討してもよいだろう。

関連記事: コードレスデータベースのAirtableがシリーズEで約290億円調達、評価額は約6300億円に

(文:Ron Miller、翻訳:Hiroshi Iwatani)
画像クレジット: ConceptCafe/Getty Images

[原文へ]

Apple Podcastランキング1位「歴史を面白く学ぶコテンラジオ」を運営するCOTENが8400万円を調達

歴史を面白く学ぶコテンラジオ(COTEN RADIO)」(YoutubePodcastSpotify)を運営するCOTEN(コテン)は6月30日、総額8400万円の資金調達を発表した。引受先には、REAPRA、ドーガン・ベータ、都築国際育英財団、ウラノス、ゼロトゥワン、個人エンジェル投資家としてメルカリ共同創設者の石塚亮氏と富島寛氏、スターフェスティバル取締役CTOの柄沢聡太郎氏など4人が参加している。この資金は、2021年中にベータ版リリースを目指す世界史データベース「coten」(仮称)の開発にあてられる。

代表取締役の深井龍之介氏によれば、「コテンラジオ」は世界史データベース事業の広報活動として始められたものだという。現代は誰もが人生をどう歩むべきか、幸せとは何かを考える時代になったと深井氏は話す。「この『悩み・問い』を解く糸口が歴史や哲学といった人文学的な思考にはあり、その社会的な価値が、史上最も高まってきている」と考える深井氏は、開発中のこの世界史データベースを「人類の叡智といえる数千年分のケーススタディを体系的にまとめ、検索可能にし、数百冊の本を読むことなく叡智を活用できるようにする試み」だと説明する。

coten(仮称)では、世界史のデータベース化は、歴史上の情報や知識を「同じ型に揃えて整理する」ことで比較を容易にし、さらに、固有名詞が頻出するため体系的な検索が難しい歴史上の出来事を、たとえば「部下に殺された歴史上の人物」のように抽象化したタグ付けで分類し、検索しやすくする。また、社会情勢を同時に盛り込むことで、歴史上の事件をその当時の気候や人口動態などを踏まえて俯瞰できるようにする。これにより「新たな仮説を立てることも可能に」なるとのことだ。

現在は、構造としての基本構想は完成しているが、ユーザーインターフェイス、ユーザーエクスペリエンス、マネタイズモデルは、ベータ版の開発を通して確立してゆくという。

「歴史を面白く学ぶコテンラジオ(COTEN RADIO)」は、2021年6月30日現在、ユニークリスナー数約14万2000人、総再生回数約1900万回、エピソード数は番外編を含めて240本、Apple Podcast総合ランキング1位となっている。

関連記事
生徒の習熟度に合わせ難易度をリアルタイム調整するAI学習システム「Monoxer」をクラーク記念国際高等学校が正式採択
習得したいけど勉強は嫌……外国語が苦手な日本人でもゲーム感覚で言語が学べる無料アプリDuolingo
Voicyとスタディプラスが「大学に特化した」音声配信サービス開始、新潟医療福祉大学が導入
Switchでプログラミングを学んでゲームを作れる、「ナビつき! つくってわかる はじめてゲームプログラミング」発表
子ども向けSTEM教材開発のワンダーラボが資金調達、累計調達額3.1億円に到達

カテゴリー:EdTech
タグ:教育 / EdTech / エドテック(用語)COTEN(企業)データベース(用語)ポッドキャスト(用語)資金調達(用語)日本(国・地域)

質と量で世界初、工学院大学が約6360手話単語と10テーマ10件の対話を収録した高精度3D日本手話データベースを提供開始

工学院大学は6月28日、国立情報学研究所情報学研究データリポジトリ(NII IDR)「研究者等提供データセット」上で、「工学院大学 多用途型日本手話言語データベース(KoSign)」(コサイン)の提供を開始した。約6360手話単語と10テーマ10件の対話が収録された、工学院大学調べで「質と量において世界初のデータセット」とのことだ。

KoSignのデータは、手話ネイティブの家系に育ったろう者で、日本手話を母語とする男女1名ずつによって、2017年から2019年にかけて、東映東京撮影所のモーションキャプチャースタジオで収録された。正面と左右に4KまたはフルHDカメラを置いて手話映像を撮影すると同時に、光学式モーションキャプチャーによる3次元動作データ(BVH形式/C3D形式/FBX形式)とKinectセンサーによる深度データ(Kinect v2のxef形式)も取得した。手話では、顔の表情や視線も大切な要素となるため、顔に33カ所、体全体に112カ所のマーカーを付けて顔や体の動きをキャプチャーしている。

日本で使われている手話には、日本手話、中間型手話、日本語対応手話の3種類があり、なかでも生まれつきのろう者が伝統的に使ってきた日本手話は、音声の日本語とは異なる文法を持ち、言語学的にも工学的にも研究があまり進んでいない。日本手話を使う人たちには、手話通訳者が使用する、話し言葉の文法と語順を基本とした日本語対応手話や、顔の表情を交えて日本手話と日本語対応手話を混在させた中間型手話では、内容を十分に理解できない場合もあるという。工学院大学の解説では、英語がよくわからない人が、英語字幕の映画を見ているような感じだと話している。

手話では3次元的な手の動きが重要となるが、これまで3次元の動作を集めた手話辞書は存在しなかった。また、紙媒体や2次元の動画教材では学習しにくいという課題があった。任意の角度から手話の動きを見られる「KoSign」は、ろう者の日常生活におけるコミュニケーションの理解度を深めると同時に、健聴者の手話学習にも役に立つと期待される。KoSignは、研究者や開発者に無料で公開されるため、所属が異なる研究者による調査でも、共通動作を対象に研究を進められるとしている。

また、データベースの単語を組み合わせて手話文を作ることもできる。下の画像は、桜島観光案内用にアンノテーション支援システムで描画し字幕を付けた応用例。

データは研究目的でのみ提供され、対象は基本的に大学の研究室や公的研究機関となる。詳細はこちら

関連記事
生命保険の約款や学校教材における漢字の誤読を低減、正確なイントネーションで音声合成を自動生成するAIシステム
習得したいけど勉強は嫌……外国語が苦手な日本人でもゲーム感覚で言語が学べる無料アプリDuolingo
グーグルが手話認識技術を開発、日本財団らが手話とろう者への理解促進を目指した手話学習オンラインゲームをベータ公開
HTCが唇・舌・歯・アゴ・頬など口元38カ所をトラッキングできる「VIVE Facial Tracker」発表

カテゴリー:パブリック / ダイバーシティ
タグ:Kinect(製品・サービス)工学院大学(組織)手話(用語)データベース(用語)日本(国・地域)

材料研究を効率化するプラットフォーム開発するのイスラエルMaterials Zoneが約6.5億円を調達

テルアビブに拠点を置くスタートアップ企業で、AIを活用して材料研究の高速化を図るMaterials Zone(マテリアル・ゾーン)は、シードラウンドで600万ドル(約6億5000万円)の資金を調達したと、米国時間4月27日に発表した。この投資ラウンドはInsight Partners(インサイト・パートナーズ)が主導し、クラウドファンディングの「OurCrowd(アワークラウド)」も参加した。

Materials Zoneのプラットフォームはさまざまなツールで構成されているが、その中核となるのは、科学機器や製造施設、実験装置、外部データベース、発表された論文、Excelシートなどからデータを取り込み、それを解析して標準化するデータベースだ。このデータベースは必要に応じて可視化することができ、研究者にとってはこれがあるだけで恩恵になると、同社は主張する。

画像クレジット:Materials Zone

「新しい技術や物理的な製品を開発するためには、まずその製品を構成する材料やその特性を理解する必要があります」と、Materials Zoneの創設者でCEOを務めるDr. Assaf Anderson(アサフ・アンダーソン博士)はいう。「ゆえに、材料の科学を理解することがイノベーションの原動力となります。しかし、材料の研究開発や生産の背景にあるデータは、慣習的に管理が不十分で、構造化されておらず十分に活用されていませんでした。そのため実験が重複したり、過去の経験を生かすことができなかったり、効果的な共同作業ができなかったりして、莫大な費用と手間が無駄になっていました」。

画像クレジット:Materials Zone

アンダーソン博士は、Materials Zoneを設立する以前、バル=イラン大学のナノテクノロジー・先端材料研究所に在籍し、コンビナトリアルマテリアル実験室の責任者を務めていた。

Materials Zoneの創設者でCEOであるアサフ・アンダーソン博士(画像クレジット:Materials Zone)

「私は材料科学者の1人として、研究開発の課題を身をもって経験しているため、研究開発がどのように改善できるかということを理解しています」と、アンダーソン博士はいう。「私たちは長年の経験を元に当社のプラットフォームを開発し、革新的なAI(人工知能)/ML(機械学習)技術を活用して、これらの問題に対する独自のソリューションを生み出しました」。

例えば、新しい太陽光発電用の透明なウィンドウを開発するためには、適切なコア材料とそのパラメータを見つけるために何千回もの実験が必要になる。Materials Zoneは、このようなデータをすべて集約して標準化し、それを扱うためのデータおよびワークフロー管理ツールを提供することで、このプロセスをより速く、より安価に行えるようにすると、アンダーソン博士は説明する。その一方で、同社の分析・機械学習ツールは、研究者がこのデータを解釈するための支援をする。

 

カテゴリー:ソフトウェア
タグ:Materials Zone資金調達人工知能 / AI機械学習データベースイスラエル材料

画像クレジット:SEBASTIAN KAULITZKI/SCIENCE PHOTO LIBRARY / Getty Images

原文へ

(文:Frederic Lardinois、翻訳:Hirokazu Kusakabe)

GraphQLサービスを提供するHasuraが約26.5億円を調達、MySQLを新たにサポート

米国時間9月8日、データベースにアクセスするためのGraphQL APIを生成するオープンソースエンジンを提供しているHasuraが、シリーズBで2500万ドル(約26億5500万円)を調達したと発表した。このラウンドを主導したのはLightspeed Venture Partnersで、以前に投資していたVertex Ventures US、Nexus Venture Partners、Strive VC、SAP.iO Fundも参加した。

今回のラウンドは新型コロナウイルス(COVID-19)の感染が拡大してから開始されたもので、同社がシリーズAで990万ドル(約10億円)を調達したと発表してから半年しか経っていない。Hasuraはこれで合計3560万ドル(約38億7500万円)を調達した。

Hasuraの共同創業者でCEOのTanmai Gopal(タンマイ・ゴパル)氏は筆者に対し「2020年に企業からの引き合いが急速に増えた。企業の顧客の成功のために、Hasuraのコミュニティと最近公開したクラウド製品への投資を加速しようと考えた。VCのインバウンドの関心を考えると、アクセルを踏み余裕をもって成長するための資金調達は理にかなっていた」と述べた。

Hasuraは同日、新たな資金調達に加え、MySQLデータベースに対応したことも発表した。これまで同社のサービスは、PostgreSQLデータベースにのみ対応していた。

左:共同創業者でCOOのRajoshi Ghosh(ラジョシ・ゴーシュ)氏、右:共同創業者でCEOのTanmai Gopal(タンマイ・ゴパル)氏(画像クレジット:Hasura)

ゴパル氏が筆者に対して述べた通り、MySQLのサポートはユーザーからのリクエストが最も多い機能だった。医療分野や金融サービス業など多くのユーザーがレガシーなシステムを使い、モダンなアプリケーションと接続しようとしている。そのためには、長く使われてきたMySQLが重要な役割を果たす。

MySQLに加えSQL Serverも新たにサポートするが、こちらはまだ早期アクセスの段階だ。

ゴパル氏は「MySQLとSQL Serverに関しては、医療や金融サービス、フィンテックのユーザーから多くのリクエストがあった。こうしたユーザーはオンラインのデータ、特にこの2種類のデータベースのデータをすでに大量に持っていて、アプリケーションをモダナイズしつつ新しい機能を構築して有効活用したいと考えている」と述べた。

Hasuraは今回の発表のわずか数カ月前に、企業向けにすでに提供していた有料のProサービスを補完するものとしてフルマネージドのクラウドサービスを公開したばかりだった(未訳記事)。

Lightspeed Venture PartnersのパートナーでHasura取締役のGaurav Gupta(ガウラブ・グプタ)氏は次のように述べている。「開発者がHasuraを採用し、GraphQLのアプローチでアプリケーションを構築していることに、たいへん感銘を受けている。特にReactのようなテクノロジーを使うフロントエンドの開発者にとっては、Hasuraを使えばアプリケーションをすべてのデータが保管されている既存のデータベースに簡単に接続でき、セキュリティやパフォーマンスの問題もない。Hasuraはクラウドネイティブのアプローチでアプリケーションを再プラットフォーム化する素晴らしい橋渡しとなるため、企業の開発者にとってもフロントエンドの開発者にとってもますます魅力的なものになるだろう」。

Hasuraは新たに調達した資金でさらに多くのデータベースをサポートし、さまざまなデータベースが加わることによる難しい技術的な課題やアプリケーションレベルのデータキャッシュシステムに取り組む計画だ。ゴパル氏は「市場獲得戦略とエンジニアリングを両輪として成長できるように企業づくりにもしっかりと投資し、こうした分野の上級職の社員を雇用している」と述べた。

画像クレジット:Fernando Trabanco Fotografía / Getty Images

[原文へ]

(翻訳:Kaori Koyama)

データエンジニアの悪夢を解消するプラットフォームDatafoldがまもなくデビュー

簡単なことだと思われていた。データベースのスキーマに小さな問題が発生し、アプリが機能不全となり、遅延が重なり、ユーザーエクスペリエンスが低下する。そこへ常駐のデータエンジニアが現れて、スキーマを修正し、すべてが丸く収まる……。今までそうだったかもしれない。だが誰も気づかない間に、そのちょっとした修正が、企業幹部が使用するすべてのダッシュボードを完全に無能化してしまう。財務が落ちる。会社の運営がめちゃくちゃになる。そしてCEOは……。会社がネットにつながっているのかすらわからない。

データエンジニアにとって、これは単に気になる悪夢ではない。日々の現実なのだ。10年以上前から「データは新しい石油だ」との馬鹿げた掛け声に踊らされた私たちは、いまだに適切なシステムや管理術を持たないまま、データを断片的に扱い続けている。データレイク(湖)はデータの大海となり、データウェアハウスは……、なんと呼ばれるか知らないが、とにかく巨大なウェアハウスとなった(データウェア「ハウス」ならぬ「大邸宅」とでも言おうか)。データエンジニアは、繁雑な現実世界と厳格なコードの世界との架け橋としての役割を担っているが、それにはもっと「マシ」なツールが必要だ。

TechCrunchの非常勤データエンジニアである私は、個人的に、これまで同様の問題と何度も格闘してきた。それが私をDatafoldと引き合わせてくれた。Datafoldは、データの品質を管理するための、生まれたてのプラットフォームだ。

品質管理と継続的インテグレーションのためのツールを備え、コードが確実に期待どおりの動作をするようにしてくれるソフトウェアプラットフォームであるDatafoldは、すべてのデータソースを統合することで、ひとつのテーブルでスキーマが変更されても、別の場所の機能に悪影響が及ばないようにする。

創設者のGleb Mezhanskiy(グレブ・メザンスキー)氏は、この問題を身をもって体験していた。データサイエンティストおよびデータエンジニアとしてLyft(リフト)に務めていた間にその問題に詳しくなり、後に「データ専門家の生産性に特化した」プロダクトマネージャーに昇格した。Lyftが規模を拡大させるにつれて、Uber(ウーバー)など同じ市場の競合企業に対する競争力を維持するために、より優れたパイプラインとツールが必要になったからだ。

彼がLyftで学んだことが、今のDatafoldの中心的な取り組みに寄与している。メザンスキー氏は、このプラットフォームは、リンクされたすべてのデータソースと、その出口との間に存在していると説明している。そこには、問題解決のための2つの難題がある。ひとつは、「データは変化し、毎日新しいデータが入ってくる。その形も、業務上の理由であったり、データソースが壊れている可能性などの理由から、まったく違って見える」ということ。もうひとつは、「このデータを転送するために企業が使っている古いコードも、企業の新製品開発などのために機能のリファクタリングが加えられ、目まぐるしく変化する(大量のエラーが発生する恐れがある)」ことだ。

式で表すならば、「繁雑な現実+データエンジニアリングのカオス=データのエンドユーザーの不幸」となる。

Datafoldでは、データエンジニアがデータの抽出と変換の際に加えた変更と、意図しない変更とを比較することができる。たとえば、以前は整数を戻していた関数が、今は文字列を戻すようになった場合は、エンジニアがどこかでミスを犯した可能性がある。Datafoldなら、BIツールが使えなくなり、管理者たちから大量の苦情が送られてくるのを待たずして、問題発生の可能性を示し、何が起きているかを特定してくれる。

ここで重要なのは、たとえ数十億ものエントリーが含まれていたとしても、各データセットに起きた変化を集約し、データエンジニアが微妙な欠陥にも気づけるようにすることで得られる効率化だ。目標は、エラーの発生率が0.1パーセント程度であったとしても、その問題を特定し、要約をデータエンジニアに送り、対処できるようにすることだ。

Datafoldは、率直に言って、処理前のデータのごとく混乱しきった市場に参入することになる。同社は、データスタックの重要な中間層に位置している。データを保管するデータレイクやデータウェアハウスの領域でも、Looker(ロッカー)やTableau(タブロー)など多数がひしめくエンドユーザーのためのB1ツールの領域でもない。Datafoldは、データエンジニアによるデータフローの管理とモニターを可能にし、一貫性と品質を確保できるようにするツールに仲間入りを果たすわけだ。

このスタートアップは、少なくとも20名以上のデータ管理部門を持つ企業をターゲットにしている。そこは、データの品質が重要となるに十分な規模で、十分なリソースを扱うデータ管理部門のスイートスポットだ。

現在、Datafoldのメンバーは3人。今月末のY Combinator(ワイコンビネーター)のデモデーで公式にデビューを果たす予定だ。彼らの究極の夢は、もう二度とデータエンジニアがデータ品質の問題で深夜に呼び出され徹夜作業を強いられる事態をなくすことだ。あなたがもしそんな経験をしている一人だったなら、この製品の価値が痛いほどおわかりだろう。

画像クレジット:Wenjie Dong / Getty Images

[原文へ]

(翻訳:金井哲夫)