MLOpsの自動化プラットホームArriktoが10億円相当を調達

エンジニアとデータサイエンティストがデータをコードのように扱うことによって、機械学習の開発ライフサイクルをスピードアップするArriktoが、今日(米国時間11/16)ステルスを終えて1000万ドルのシリーズAを発表した。このラウンドはUnusual Venturesがリードし、UnusualのJohn Vrionis氏が取締役会に加わった。

ArriktoのCEOで共同創業者のConstantinos Venetsanopoulos氏は、次のように説明する: 「Arriktoの技術により企業は、機械学習のアプリケーションの実装と管理に伴う複雑性を克服できる。弊社は、エンドツーエンドの機械学習パイプラインのセットアップをきわめて容易にする。もっと具体的に言うと、われわれはMLのモデルのプロダクション向けの構築と訓練とデプロイをKubernetesを利用して容易にし、すべてのデータをインテリジェントに管理する」。

今日のデベロッパー中心のプラットホームの多くがそうであるように、Arriktoも「シフトレフト」(前倒し)がすべてだ。同社によると、現状では機械学習のチームとデベロッパーチームが同じ言葉で話をしていない。むしろ、別々のツールを使ってモデルを作り、そしてそれをプロダクションに導入している。

画像クレジット: Arrikto

「DevOpsがデプロイメントをソフトウェア開発ライフサイクル中のデベロッパーへシフトレフトしたように、Arriktoはデプロイメントを機械学習ライフサイクル中のデータサイエンティストにシフトレフトする」、とVenetsanopoulos氏は説明する。

Arriktoはまた、機械学習の実装を多くの企業にとって困難にしている技術的障害を減らすことも狙っている。Venetsanopoulos氏によると、Kubernetesが企業に、シンプルでスケーラブルなインフラストラクチャの形を見せたように、Arriktoは、MLのプロダクションパイプラインのシンプルな形を見せる。しかもそれを、Kubernetesネイティブなやり方で行う。

ArriktoのCEO、Constantinos Venetsanopoulos。画像クレジット: Arrikto

ArriktoのコアにはKubeflowがある。それはGoogleで生まれた、Kubernetes用のオープンソースの機械学習ツールキットだ。そして多くの点でArriktoは、Kuberflowのエンタープライズ対応バージョンと考えることができる。また同社が作ったMiniKFはKubeflowをラップトップで動かせるようにし、そのためにKaleを利用している。それによりエンジニアは、自分のJupyterLabノートブックからKubeflowのパイプラインを構築できる。

Venetsanopoulos氏によると、Arriktoの技術は三つのことをする: Kubeflowのデプロイと管理を単純化して、データサイエンティストが既知のツールでそれを管理できるようにし、データサイエンスのためのポータブルな環境を作って、複数のチームやクラウドにまたがるデータバージョニングとデータ共有ができるようにする。

Arriktoが2015年にギリシアのアテネでローンチしたときは、ほとんど報道もされなかったが、共同創業者のVenetsanopoulosとCTOのVangelis Koukis氏はすでに、そのプラットホームを複数の大企業に採用させることに成功していた。Arriktoの現在の顧客は100社あまりで、同社は名前を具体的に挙げないが、Venetsanopoulos氏によると、世界最大の石油や天然ガス企業も含まれている。

それに、アテネとスタートアップハブは結びつかないかもしれないが、Venetsanopoulos氏によるとそれも変わりつつあり、今では多くの才能が育っている。ただしArriktoは、今回の資金でシリコンバレーに営業とマーケティングのチームを置くつもりだ。Venetsanopoulos氏は曰く、「ギリシアは人材も大学も最上級だが、未開拓だ。競争のないことが、弊社に幸いしているかもしれない」。

UnusualのVrionis氏は、こう言っている: 「エンタープライズはクラウドネイティブなソリューションを利用して機械学習を有効に使おうとしている。今そこに、強力な市場機会がある。Arriktoは、データとモデルとコードのライフサイクル全体をカバーするMLOpsへの革新的で全体的なアプローチを採用している。データサイエンティストたちは、エンジニアリングのチームがいなくても、自分たちが力を持ち、自動化とコラボレーションを増強して、市場化までの時間を加速できる」。

画像クレジット: Arrikto

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

CometMLは「機械学習のためのGitHub」になることを狙う

Comet.mlは、データサイエンティストと開発者たちが、自身の書く機械学習モデルのモニタリング、比較、そして最適化を簡単に行えるようにする。このニューヨークを拠点とする企業は、本日(米国時間4月5日)そのプロダクトの提供を始めた。同社はTechStarsが支援するAmazon Alexa Acceleratorプログラムを修了し、230万ドルをシードラウンドで調達した。このラウンドを主導したのはTrilogy Equityパートナーズで、他にTwo Sigma Ventures、Founders Co-Op、Fathom Capital、 TechStars Ventures、そしてエンジェル投資家たちが参加した。

このサービスが提供するのは、機械学習(ML)実験コードとその結果をまとめることのできるダッシュボードだ。さらに、このサービスでは、実験のハイパーパラメーターを調整することで、モデルを最適化することも可能だ。モデルを訓練する際に、Cometはその結果を追跡し結果のグラフを提供する。それだけにとどまらず、コードの変更を追跡して、後から取り込むことを許し、実験のさまざまなバージョンの異なる側面をすべて後から比較できるようにする。

開発者たちは、簡単に自らの機械学習フレームワークとCometを統合することができる。たとえ使っているのがKeras API、TensorFlow、Scikit Learn、Pytorch、あるいは単にJavaコードであっても関係ない。使い始めるためには、開発者は単にCometMLのトラッキングコードをアプリに追加し、いつものように実験を実行するだけだ。このサービスは、モデルをどこで訓練するかとは完全に無関係であり、もちろんその結果はチームメンバーと共有することができる。

理想としては、これによってデータサイエンティストは既存のワークフローと開発ツールを使い続けることができる筈で、それらに加えて、実験の効果をよりよく把握できる新しいツールが追加されたということである。

CometMLの共同創業者兼CEOのGideon Mendelsは「私たちは現在のMLチームが、10年から15年前に見かけたソフトウェアチームのように見えることに気が付きました」と語る。現代のソフトウェアチームは、GitHubのようなバージョン管理を提供するツールを使ってコードを共有しているが、MLチームは依然として電子メールでデータやコードを共有している。「主な課題は作業者の規律ではなく、ツールの状況なのです」とMendelsは語る。「現在使えるGitHubのようなツールは、ソフトウェアエンジニアリングのための素晴らしいソリューションですが、MLチームにとってはそうでもありません。ここでもコードが主要なコンポーネントであることには変わりがないのですが、それがすべてではないのです」。

Mendelsによれば、そのクローズド・ベータ期間中には、約500名のデータサイエンティストたち(いくつかのトップテクノロジー企業からの参加を含む)がサインアップしたということだ。これまでのところ、これらのユーザーたちはプラットフォーム上で約6000のモデルを構築している。

将来的には、CometMLチームは、より優れていて正確なモデルが開発できるように、開発者たちに対してより多くのツールを提供する予定だが、Mendelsによれば、そのためには同社はこの最初のバージョンを投入する必要があったのだという。

CometMLは、試してみたいすべての開発者が利用できるようになった。GitHubと同様に、公開プロジェクトを幾つでも作成できる無料枠があり、プロジェクトをチーム間でプライベートに保つ有料枠が提供されている。

[ 原文へ ]
(翻訳:sako)

画像:Pete Saloutos/Getty Images

確定報:Periscope Dataが2500万ドルをBessemer Venture Partnersの主導で調達

pasted-image-at-2016_11_07-12_44-pm

データサイエンティストたちが、その解析内容を聴衆に理解して貰いやすいビジュアルへ素早く変換することを助けるPeriscope Dataが、シリーズBファンディングで2500万ドルを調達したことが確認された。

私たちは、もともとこの資金調達に関するニュースを先週報告していたが、主導投資家の名前を誤って報告していた。ラウンドを手動したのはBessemerである(先の報告ではDFJだとしていた)。 これにDFJ、Susa Ventures、Innovation Endeavors、そしてAngelPadという投資家たちが加わった。

契約の一環として、BessemerのEthan Kurzweilが、Periscope Dataの取締役会に加わった。

CEOのHarry Glazerが、TechCrunchに語ったところによれば、会社にとっての次の段階は、プロダクトを拡張し市場開拓戦略(go-to-market strategy)をとることによって、より大きな企業ユーザーへ対応可能にして行こうということである。彼はPeriscope Dataのとっての大きな挑戦の一つは、データサイエンティストたちへの売り込みだと語った。

「データサイエンティストたちの目に止まりエンパワーを与えることは、セールス部門や、IT部門や、人事部門の目に止まることとは全く違うことなのです。後者のセールスサイクルは比較的良く確立されています」とGlazer。「技術的な聴衆に売り込むことに関しては、Ethanが深い経験を持っています」。

Periscope Dataは、データ量に基づいて課金を行い収益を挙げている。しかしGlazerはより大きな企業向けに、よりプレミアムな機能を追加するチャンスを探っている。これらの機能は、レポート作成とコラボレーションから、セキュリティと認証の範囲までをも覆うものである。

Crunchbaseによれば、この最新のラウンドにより、Periscope Dataの合計調達額は3450万ドルに達した。

[ 原文へ ]
(翻訳:Sako)

Microsoftがプロ養成講座を提供、データ・サイエンティストのスキルギャップを埋める

microsoft

Microsoftは求人市場にもっとデータ・サイエンティストが欲しいと考えている。若い人は真新しい知識を獲得するところから始める必要があるだろうし、キャリアを進めているプロはこれまでの経験を軸に技術を身につけられるようにする必要がある。

どちらの場合でもスキルギャップを埋めるため、Microsoftはデータサイエンスの一連の講座を edX.orgを介してローンチした。ハーバード大学とMITが立ち上げたedX.orgは、非営利で運営するオンライン学習の場だ。

データサイエンスのカリキュラムは、Microsoft Professional Degreeのプログラムが初めて提供する講座だ。Microsoftが主導するこのプログラムは、社会人が重要な分野でのスキル獲得を促すことが目的だ。本日ローンチしたプログラムについてMicrosoftは「雇用主が認められる大学レベルのカリキュラムです。キャリアのどの段階にいる人も受講できます」とプレスリリースで伝えた。

データ・サイエンティストは、求人数が候補者数を上回る、現在最も求められている職種の一つだ。

Microsoftのコースは9つのクラスと最終プロジェクトで構成される。全てのクラスは無料で聴講することができる。しかし、Microsoft Professional Degreeの認定を得るには、生徒はカリキュラムの10ステップ毎に証明書を購入しなければならない。

オリエンテーションのクラスは25ドルだ。「データサイエンスとアナリティクスのための統計的思考」の認定は99ドルで、他のクラスの認定はそれぞれ49ドルだ(データサイエンスコースを全て完了するには516ドルかかる)。

生徒は特定コースのセッションに登録する必要がある。各クラスのスケジュールはこのカレンダーを参照してほしい。受講を検討する生徒は詳細なシラバスを読み、各授業の選択科目を検討し、クラスのedXページから入学できる。各ステップは最低4時間から最大8時間で完了する。

ITオンライン教育の分野に進出する大手テクノロジー企業はMicrosoftが初めてではない。GoogleはUdacityと提携して、Androidのナノ学位や他のクラスを提供している。Amazonは、ビッグデータのクラスを始め、高度な技術スキルが取得できるAWSトレーニングの提供と認定を行っている。

[原文へ]

(翻訳:Nozomi Okuma /Website