もうすぐ、強力な予測ツールを開発するのに何も特別なものは必要なくなる。ごく普通のタッチスクリーンデバイスと、自由にアクセスできるデータさえあればいい。MITとブラウン大学の研究者による新しい実験は、「Northstar」と呼ばれる対話型データシステムに、「機械学習モデルを即座に生成する」能力を追加することに成功した。既存のデータセットに適用して有用な予測を生成できる。
研究者が示した例としては、医師がこのシステムを利用し、患者の医療履歴から、特定の疾患にかかる可能性を予測するというものがある。また、事業主が過去の売上データを使用して、より正確な予測ができるようにするというものもある。いずれも手作業による煩雑な分析は必要なく、迅速に処理できるものだ。
研究者はこの機能を、Northstarシステムの「仮想データサイエンティスト(VDS)」と呼んでいる。この名前は、人間のデータサイエンティストに取って代わるもののような印象を与えるが、人材がすぐに確保できないような状況では、実際にそれも可能だろう。一般的な医師の診療所に、専門のデータサイエンティストがいるわけでもないし、ほとんどの中小企業が、そうした人を常に雇っておけるわけでもない。さらに、個人経営のコーヒーショップや小売業者も、普通はこうした機能を利用することはできないだろう。
このツールは、進化し続ける自動機械学習技術を利用して新たに開発されたもので、AI技術を利用できる人の数を増やすのに役立つ。
Northstar自体は4年以上かけて開発されたもの。複数のプラットフォーム上で動作する。まず空白のキャンバスを提示し、ユーザーがデータセットをアップロードすると、独自のインターフェイス上に箱として表示される。ユーザーは、それらの箱をキャンバスの真ん中あたりにドラッグしてから、箱と箱の間に線を引いて接続する。それにより、あらかじめ選択したアルゴリズムに従って、互いに組み合わせて処理すべきものであることを指示するわけだ。
たとえば、患者の代謝率のデータセットと年齢のデータを持ってきて組み合わせることで、それらの2種類の要因から特定の疾患が発生する頻度を予測するといったことが可能になる。このように、仮想データサイエンティスト機能を使用することで、複数の入力を組み合わせたAIベースの予測分析を生成することが可能となる。
研究者はこのVDSシステムを設計する際に、自動化された機械学習として、これまでで最も速く動作するアプリケーションとなるようにした。それも、このシステムを誰でも使えるものにするためには重要なポイントだ。というのも、このデジタルのホワイトボードで作業しても、その結果が得られるのに何時間も待たされるのでは、とても実用的とは言えないからだ。今後は、エラーの報告機能を改善することにしている。専門家ではないユーザーにとって、単に使いやすいだけでなく、何かおかしくなったときに、どこで間違えたのかをはっきりと示すことができるようにする。次に使うときには、そこを修正できるようにするためだ。
[原文へ]
(翻訳:Fumihiko Shibata)