OpenAIがテキストベースのAI機能利用が簡単になる汎用APIを開発

これまでにOpenAIご自慢の機械学習ツールセットを試してみたいと思ったことがあるだろうか。それがずっと簡単なものになった。同社は、開発者がAIツールを「事実上どんな英語のタスクに対しても」呼び出すことができるようなAPIを発表した(OpenAIリリース)。

基本的には、英語の単語を理解することを求められるタスクがある場合、OpenAIはそれを自動化したいと考えている。少なくともプライベートベータに参加できれば、自然言語理解モデルのGPT-3ファミリーのさまざまな機能を、開発者は自由に使用することができる。また、アクセスのリクエストはここから可能だ。

実際にどのように見えるものなのかは、何をしたいかに依存するため、説明するのが少し難しい。例えば大量のテキストを一度に調べて、記載に関する質問に回答したり、関連する部分を見つけたりする機能を利用できる。短いデモビデオで、OpenAIはこれがどのように機能するかを説明している。パンに関するWikipedia記事に対して、「なぜパンがとてもふわふわ(fluffy)なのか」と尋ねると、記事の中にあるパンのテクスチャーとその形成に関する部分が返される。

これはシンプルな例だが、GPTを使ったテキストアドベンチャーゲームである有名な「AI Dungeon」はもっと複雑なものだ。AIには多数のD&Dソースブックと冒険が与えられ、そうした基礎に基いてプレイヤーの入力に対して即興的な旅が与えられる。これまでは、こうしたことは基本的にはモデルのバージョンをローカルで実行するという面倒な手段を使って達成しなければならなかったが、今では単純にAPIを経由して入力を送り込むことができるようになった。

基本的に、これはGPT-3の幅広い言語理解と生成機能にアクセスするためのはるかに簡単で単純な方法なのだ。単にテキストを入力して、テキストを出力するだけだ。

関連記事:OpenAIの新たな音楽活動はエルビスの不気味の谷に入った

「私たちは、このAPIがAIを活用した有益な製品を開発するための障壁を大幅に下げ、今日の段階では想像しがたいツールとサービスが生み出されることを願っています」と同社はブログ投稿で述べている。確かに1年か2年前にはAI Dungeonを想像することは困難だっただろう。

また、APIの有害または乱用は直ちに禁止されることも明記されており、OpenAIにとっては、モデルを実際に世の中にリリースするよりも安全なことと思われる。「モデルが実際の現場でどのように利用されるのかを予測することは難しいので、有害なアプリケーションが生まれたときにアクセスを制御できないオープンソースモデルをリリースするよりも、APIを介してリリースを行い、時間をかけてアクセスを広げて行くほうが、本質的に安全だと感じています」とブログには書かれている。

これまでのところOpenAIは数十社と提携して、世の中に広く提供する前にAPIをテストしている。チャットボット、教材、法的調査など言語は私たちが行うほとんどすべての定義と記録に使用されているため、この種の応用には終わりがない。とはいえこのようなAIエージェントが本当に役立つ場所を正確に見つけるためには、多少実験が必要だ。

既にAI Weirdness(AIウィアドネス)のJanelle Shane(ジャネル・シェーン)氏は、犬を評価している別のTwitterアカウントを参照して、無限に犬を評価し続けるボットを作成してアイデアを実験している。

トップ画像クレジット: OpenAI
原文へ
(翻訳:sako)

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。