GPT-3に対抗してAI2がQ&Aを重視したオープンなライバルAIを披露

OpenAI(オープンエーアイ)のすばらしいAI言語モデルであるGPT-3は、多くの機能を備えているが、1750億個のパラメータを備えたそのモデルを、特にすっきりしているという人はいないだろう。このたびAllen Institute for AI(AI2、アレン・インスティチュート・フォー・エーアイ)が、GPT-3と同等もしくはそれ以上の質疑応答能力を持ちながら、サイズが10分の1というモデルのデモを行った。
AI2のモデルであるこのMacaw(マカー)は、標準的なテストで人間レベルのパフォーマンスを発揮するAIを作ることを目的として、非営利団体AI2で行われてきた研究から生まれた。

AI2の責任者であるOren Etzioni(オーレン・エチオーニ)氏は「非常に高いスコアを得た後、モデルはより難しい問題に移っていきました。人間にとって最も簡単な質問が、機械にとっては最も難しいというパラドックスがありますが、このときの最大のギャップは『常識』でした」と語る。

たとえば「トム・ハンクスが月に降り立ったのはいつですか?」と尋ねてみるのがその例だと彼はいう。GPT-3はこの質問に1995年と答える、なぜなら映画『アポロ13』が公開されたのが1995年だったからだ。しかしMacawは、私たちが知る限り、トム・ハンクスが実際に月に行ったことはないと正しく指摘する。

AI2は、その違いを示す例題(「デモ」という言葉は少し過剰な表現かもしれない)を公開しているが、その中ではトリッキーな質問やそれほどでもない質問に対してMacawの方がしばしばより良い答えを行っている。

どちらもかなりの高確率で失敗したり、不合理な答えを出したりすることがあるので、両者を比べてみるのはおもしろい。Macawは誰が何をしたかを追跡するのは得意だが、蛇には足があると信じている。GPT-3の回答は(おそらく過剰なほど)自信に満ちていてしかも読みやすいが、その内容が、新型コロナウイルスは「実験的で危険な新薬」であるというような陰謀論的なものであってもその態度は変わらない。

いくつか例を挙げてみよう。

  • 結婚生活をより安定させるにはどうしたらいいですか?
    Macaw:コミュニケーション。
    GPT-3:私なら自分が常に正しいということを確認するでしょう。
  • もしも鳥に翼がなかったら、どのような影響があるのでしょうか?
    Macaw:飛ぶことができなくなります。
    GPT-3:それは質の悪い鳥ですね。
  • クランベリージュースを自分で注いだ後、うっかりしてティースプーン1杯ほどのグレープジュースを注いでしまいました。見た目は大丈夫です。その匂いを嗅いでみましたが、風邪をひいていたので何の匂いもしません。ともあれ、あなたはとても喉が渇いています。だからそれを飲むことにします。次はどうなりますか?
    Macaw:気持ち悪くなる。
    GPT-3:たぶん死ぬ。
  • ヘビはどうやって移動するの?
    Macaw:四つん這いで進みます。
    GPT-3:ヘビは筋肉で地面を押して移動します。どの方向にも動くことができますが、後ろ向きに動くことはできません。

子どもでも答えられるような、基本的な質問に失敗しない質疑応答AIの実現はまだまだ遠そうだ。しかし、MacawがGPT-3と同程度の成功を、はるかに少ないデータ量の処理で達成していることにも注目したいと思う。エチオーニ氏は、これはGPT-3に取って代わろうとするものではなく、世界中で行われている言語の生成と理解に関する研究の新たな一歩であることを明言した。

彼は「GPT-3はすばらしいものですが、1年半前にローンチしたばかりで、アクセスも限られています」という。GPT-3が示す能力はすばらしいものの「しかし、私たちは、より少ない資源でより多くのことができることを学んでいます。たとえば1750億個のパラメータが必要となるようなものでも、私たちならおそらく100億個のパラメータでできるでしょう」とエチオーニ氏は語る。

優れた質疑応答AIは、パーティーの余興に役立つだけでなく、音声による検索などで中心的な役割を果たす。簡単な質問に外部と通信することなくすばやく正確に答えられるローカルモデルは、基本的に価値がある。たとえばAmazon Echo(アマゾン・エコー)自身がGPT-3を実行することはまずないだろう、それは、スーパーに行くために大型トレーラーを買うようなものだ。大規模なモデルはこの先も有益だが、今後はよりコンパクトなモデルが使われるようになるだろう。

ここでは示されていないものの、AI2チームによって積極的に追求されているMacawの機能の1つが、その答を説明させることだ。なぜMacawはヘビに足があると思っているのか?それが説明できないと、どこでモデルが間違ったのかがわからなくなってしまう。しかし、エチオーニ氏は、これはそれ自体が興味深く難しいプロセスであるという。

「説明の問題点は、本当に誤解を招く可能性があることです」と彼はいう。彼は、Netflixが視聴者に番組を推薦した理由を「説明」している例を挙げたが、それは複雑な統計モデルに関係した動作理由の説明ではない。人は機械に関係する説明を聞きたいのではなく、自分の心に関係する説明を聞きたいのだ。

エチオーニ氏は「私たちのチームは、こうした『誠実な説明』を開発しています」と語り、今回いくつかの研究成果を発表したものの、まだ一般に公開できる状態ではないと述べた。

しかし、AI2が開発しているほとんどのものと同様に、Macawもオープンソースだ。気になる人は、ここにコードがあるので、是非とことん遊んで欲しい。

画像クレジット:Andrii Shyp / Getty Images

原文へ

(文:Devin Coldewey、翻訳:sako)

突然文章が書けなくなる……、Sudowriteの強力なツールがあなたに代わって筆を走らせる

オフィスビルや工場、高層ビルが林立し、光と影が織り成す光景は、夜の街に生命の息吹を感じさせる。この都会のジャングルに生息するのが我々の卑劣なヒーロー、Amit Gupta(アミット・グプタ)だ。彼から漂うのは洗濯物とヘアジェル、そしてかすかなペパーミントの香り。シルクのスーツにはたっぷりのコロンと、革とムスクの柔らかくて暖かな香りがブレンドされている。ウールハットは明るいトーンのベージュ、ネクタイはダークトーンのピンク色だ。スタートアップ創業者である彼の肌は、生まれたての赤子のように柔らかで温かい。握手は力強く、物腰は柔らかである。深い信念を持つ彼の会社の名はSudowrite(スドウライト)だ。共同創業者の名はJames Yu(ジェイムス・ユー)。ユー氏はParse(パース)を設立し、後にFacebook(フェイスブック)に売却した人物でもある。同社は名だたるエンジェルの数々を投資家として持ち、資金調達額は3百万ドル(約3億4000万円)におよぶ。

クルマの騒音、子どもの遊ぶ声、テレビの音、ラジオの音、火災報知器の音、パトカーのサイレンの音、酔っぱらいのつぶやきなど、都会の不協和音と膨大なシンフォニーが流れる中、グプタは血も涙もないニュースを受け取った。白血病と診断されたのだ。彼の人生は完全に狂ってしまった。自分の人生を見つめ直し、自分にとって何が大切なのかを真剣に考える時が来たのだ。彼は深呼吸をしてみる。自分にはもう時間が残されていないのか、それともこれは単なる警告なのか。

Sudowriteにスタートアップとは何かを説明してもらうと、息が止まるほど笑える結果となった。実におもしろい(画像クレジット:Sudowrite)

ドローンのレンタルカメラ用の奇妙なアクセサリークリエイティブな写真マウントのアイデアで知られていた既存のスタートアップ、Photojojo(フォトジョジョ)もいまや昔のこと。会社を売却した彼は、次に何をすべきかを考えなければならなかった。会社を売却して得たお金は、薄い黒い葉のように貧弱で、悪魔の翼のようによじれている。紙のように薄く、煙のように薄く、絹のように薄く、まるで蜘蛛の巣のようだ。

ここまでの記事が奇妙に感じるのは、筆者がSudowriteというツールを使って説明文を書いたからだ。爆笑ものだが、信じられないほど強力なツールでもある。常に意味をなすとは限らないが、重要なのはそこじゃない。このツールはライターに完全に取って代わるものではなく、要約したり拡大したり、時には執筆過程で不足している創造力に火をつけるためのものなのである。この記事の最初の部分が完全に狂っていることからもわかるように、そういう意味でこのツールは非常に良く機能している。

「2014年に病気になり、人生を見つめ直すことになった時にPhotojojoを売りました。私はシリコンバレーを完全に離れて旅に出ました。自分の死ぬまでにしたいことリストにあったことはすべてやりました。しかし移植から5年が経過し、おそらく白血病で死ぬことはないだろうということになったのです」とSudowriteの創業者でCEOのグプタ氏は振り返る。「それで、じゃあこれから人生で何をしようかと考えました。しばらくはコーチングをしていました。そして、ここ数年はSF小説を書いていて、それに夢中になっていました。どん底から這い上がっていくのはとても楽しいことでしたし、私にとってはとても新しいことでした」。

SF作家としての道を歩む中で、グプタ氏はほとんどの作家が経験する問題に直面した。「ライターズブロック」である。書くという作業はここまで難しいことだっただろうか?

「Sudowrite はさまざまな問題を解決してくれると思いますが、その具体的な内容は作家ごとに異なります。私が感じるところの執筆作業における問題点の1つは、非常に孤独であるということでした。すべてが協力的なスタートアップの世界から来たためなおさらでしょうか。役に立っているのかもよくわからない週に一度の読書グループ以外には何の出口もなく、キーボードの前にただ座って行き詰まると机に頭を叩きつけ、とても孤独に感じていました。私たちが最初に考えたのは、隣に座っている創造的なパートナーのような役割を果たすものを作れないか、ということでした。行き詰まったときに彼らに向かって『これが解明できないしうまくいかない。アイデアをくれないか』と相談できる何か。それが当初の目的でした」とグプタ氏は説明する。

創業者のアミット・グプタ氏とジェイムス・ユー氏は、山頂で発見された。彼らは一般的な家猫よりも少しだけ大きく成長することで知られている。墓というよりはゴミ山のような土の中に人骨がごちゃごちゃと横たわっていて、眼窩はまっさらな空を見つめている。創設者らは下駄についた泥を払い、戦いに備えて知恵を絞る。ドラゴンの息づかいがすぐそこに迫っている(写真のキャプションはSudowriteによるもの。キャプションの正確性については確認していない)

「人間のリーディングパートナーのように、うまくアイデアを出し合える相手を作りたいと考えたのです。また、脚本家などのエンターテインメント業界の人々と話をしているうちに、特定のニーズがあることに気がつきました。例えば自分が書いた脚本があって、それの1ページ版と3ページ版を作成しなければならない場合などがあります。非常に特殊な業界の仕事ですが、AIにとってはとても簡単なことです。これはあまりクリエイティブな作業ではないため、Sudowriteのようなツールを使えば彼らがしなければならない嫌な作業を何時間も省くことができるのです。用途はたくさんあると思いますが、インスピレーションを刺激して仕事の流れを良くするのが主な目的です」。

1つの文章をSudowriteによって創造的に膨らませてみた。より細かく描写したものや、心の葛藤を表したもの、またはより簡潔に説明したもの(筆者の最も苦手とするもの)など、AIの力によってシンプルな文章からいくつものバージョンが出来上がる

グプタ氏は作家の孤独感を解消するためにSF小説のライティンググループに参加していたのだが、そこで出会ったのが共同創業者で元Parse創業者のユー氏である。2人はGPT-3をベースにしたアプリの初期バージョンをともに作りあげ、有料の顧客を獲得し始めたところで資金調達を決意した。

関連記事:Copy.aiのAI利用記事作成システムは「使える」レベルの驚異的な出来、日本語も対応

「当初このプロジェクトを立ち上げるために100万ドル(約1億1300万円)程度の資金を集めようと考えていました。最終的には300万ドル(約3億4000万円)を調達しましたが、そのほとんどが個人投資家によるものでした。これは意図的なものです。ベンチャーキャピタルからのプレッシャーを感じることなく、自分たちのペースで実験したり、奇妙なことに挑戦したりするのを許容してくれる人たちが欲しかったのです」とグプタ氏は話している。

同社のエンジェル投資家リストはそうそうたる顔ぶれで、Medium(ミディアム)およびTwitter(ツイッター)の創業者であるEv Williams(エヴァン・ウィリアムズ)氏、Gumroad(ガムロード)の創業者であるSahil Lavingia(サヒール・ラヴィンギア)氏、Parse(パース)の創業者であるKevin Lacker(ケヴィン・ラッカー)氏、WordPress(ワードプレス)の創業者であるMatt Mullenweg(マット・マレンウェッグ)氏、Rotten Tomatoes(ロッテン・トマト)の創業者であるPatrick Lee(パトリック・リー)氏などが名を連ねている。また、Big Fish(ビッグフィッシュ)やAladdin(アラジン)の脚本家であるJohn August(ジョン・オーガスト)氏、Bourne Ultimatum(ボーン・アルティメイタム)やOceans Twelve(オーシャンズ12)の脚本家兼監督であるGeorge Nolfi(ジョージ・ノルフィ)氏など、エンターテインメント界の名だたるメンバーが揃っている。

現在、同社のユーザー数は300人から400人で、プラットフォームの利用料は月額約20ドル(約2300円)だ。今回の資金調達ラウンドにより、創業チームはチーム規模を少し拡張することができたようだ。

「今回の資金調達で実現したことは、何といっても人材の確保です。当社にとって初となる機械学習担当者、開発者、リードデザイナーを採用しました。この3つのポジションを確保することができましたが、しばらくはこの規模を維持するつもりです。当社のユーザーは皆、口コミで集まってきた人たちで、幅広いジャンルの方がいます。小説や脚本を書いている人もいれば、Substack(サブスタック)のニュースレターを作っている人もいます。また、職業として文章を書いているユーザーもいます。変わった使用例もあります。Sudowriteを使って説教を作る宗教指導者や、瞑想のための文書を書く人、また、ロールプレイングゲームを作るユーザーもいます。非常に幅広い層に支持されています」。

Sudowriteは、これまでクローズドベータ版を提供していたが、これからは自身でベータ版に登録して試すことが可能だ。

以下に、グプタ氏が記録したデモビデオを添付しておく。数カ月前のものだが、このツールがどう機能するのかをより詳しくおわかりいたけると思う。

画像クレジット:Sudowrite

原文へ

(文:Haje Jan Kamps、翻訳:Dragonfly)

マイクロソフト、新しくAzure OpenAI Serviceを通じ言語AI「GPT-3」を招待制で提供開始

Microsoft(マイクロソフト)は米国時間11月2日、Azure OpenAI Serviceの提供開始を発表した。Azure OpenAI Serviceとは、その名の通り、OpenAIの機械学習モデルをAzureプラットフォーム上で利用できるようにするものだ。具体的には、OpenAIの画期的な大規模自然言語処理モデルである「GPT-3」が対象となる。GPT-3は、適切な環境下であれば、わずかなプロンプトで人間のようなテキストを生成することができる。

しかし、少なくとも今のところ、すべてのAzureユーザーがアクセスできるわけではない(たとえお金を払う用意があっても)。アクセスは招待制で「AI技術を使用するための責任ある原則と戦略を取り入れた、明確に定義されたユースケースを実装する予定の顧客」が対象とのこと。Microsoftは、GPT-3の悪用や誤用のケースを見つけるための安全性モニタリングと分析を提供し、GPT-3をベースにしたチャットボットが(たとえそれに値するとGPT-3が考えたとしても)重役に悪態をつき始めたりしないようにするためのフィルターを提供する。

画像クレジット:Microsoft

ここで注目に値するのは、OpenAI自体は2020年、すでにGPT-3のAPIを公開していることだ。ただし、まだウェイティングリストがある。MicrosoftもGPT-3を使って、デベロッパーのコード作成を支援する「GitHub Copilot」ツールをすでに構築している。しかし、Azure以外でGPT-3にアクセスする方法はすでにあるが、Microsoftは「セキュリティ、アクセス管理、プライベートネットワーク、データ処理の保護、またはスケーリング能力の追加レイヤー」を提供できるとしている。

Microsoftは2019年にOpenAIに10億ドル(当時約1080億円)を投資し、GPT-3のライセンスを取得しているので、今、より広い範囲の製品に導入しようとしているのは驚くことではない。

OpenAIのSam Altman(サム・アルトマン)CEOはこう語った。「GPT-3は、自然言語のための最初の強力な汎用モデルであることを証明しました。1つのモデルであらゆることに使えるので、非常に簡単に試すことができ、デベロッパーにとって使いやすいものです。以前から、可能な限り広くスケーリングする方法を見つけたいと思っていました。その点が、Microsoftとのパートナーシップで最も期待していることです」。

画像クレジット:Westend61 / Getty Images

原文へ

(文:Frederic Lardinois、翻訳:Aya Nakazato)

OpenAIが自然言語AIコーダーのCodexをアップグレード、プライベートベータを開始

OpenAI(オープンエーアイ)は、2021年7月に発表したAIを活用したコーディングアシスタントのCodex(コーデックス)に、すでにいくつかの大きな変更を加えている。現在システムは、平易な英語のコマンドを受け入れ、実際に動作するコードをリアルタイムで出力する。変数に名前をつける必要すらなくゲームやウェブアプリを作成できるようにするのだ。数少ない幸運なコーダーたちは(そしてご想像できるようにノンコーダーたちも)、無償のプライベートベータで提供される新しいCodex APIを使って、その使い心地を試すことができる。

Codexが、OpenAIの多用途言語エンジンであるGPT-3であることはよく知られているが、特に通常の文書ではなくコード生成に向けてのみ訓練されたものである。これにより、コードの行を完成させたり、セクションを完全に生み出したりすることができる。とはいえ、最初発表されたときには、ノンコーダーが実際に対話して利用できるようなものではなかった。

この状況が今回の新しいAPIでは変わった。たとえば「ボールを画面の端で跳ね返らせる」とか「パブリックAPIを使用してそのデータをダウンロードし、日付で並べ替える」といった日常的なリクエストを解釈し、複数のプログラミング言語の1つで実際に動くコードを生成するのだ。

私はOpenAIの共同創業者であるGreg Brockman(グレッグ・ブロックマン)CTOと、CodexのリーダーであるWojciech Zaremba(ボイチェフ・ザレンバ)氏が、簡単なゲームをゼロから作成しながら、舞台裏で何が起こっているのかを説明するライブデモに参加した。

「プログラミングとは、目標を考えて部分へと分割し、そして分割された部分のためのコードを実際に作成していくことです」とブロックマン氏は説明した。Codexの目的は、コーダーが後者よりも前者の部分により多くの時間を費やせるようにすることだ。結局のところ、膨大な量のコードが、他人が以前に行ったことを真似たり完全にコピーしたりしている。もちろんそれも創造的な行為ではあり得る。だが少しばかりのコードのテストのために行うウェブサーバーの展開のような基本的な作業に、想像力を駆使する人はいないだろう。ブロックマン氏はそのことを「次のことを表示するウェブページを作成せよ」といった感じのシンプルな一行で実現してみせた。

画像クレジット:OpenAI

1秒後には、その要求を完全に標準的な方法で実現する10行ほどのJavaScript(ジャバスクリプト)プログラムが生成された。

「これはプログラミングの中でも面倒な部分です」とブロックマン氏はいう。「私はこの種のコードをおそらく数十回以上書きましたが、どのようにやっていたかを正確には覚えていないのです。私はこうしたAPIを正確には知りませんし、覚える必要もないのです。少ないキーストロークや操作手順で、同じことを簡単に行うことができるようになるのです」。

Codexは、基本的にGitHub(ギットハブ)上のすべての公開コードを中心に用いてトレーニングされているので、標準的な作法を熟知している。そこでは、ウェブサーバー、キーボードコントロール、オブジェクト操作、アニメーションなどのコードが何百回も誰かによって書かれているのだ。また、自然言語側ではGPT-3が持つ通常の理解能力が備わっているので「それを小さくしてトリミングして」といってから「それの水平位置を左右の矢印キーで制御せよ」といった場合に「それ(it)」が同じものを指していることをシステムは理解することができる。

また、同システムは数キロバイトに相当する自分自身のコーディングコンテキストを知っているために、準拠する必要のある命名規則、ユーザーの入力が暗示する既存の境界と要求およびその他の情報を認識している。

また、コードコーパスに埋め込まれている一般的知識も認識している。例えばブロックマン氏がシステムに対して「丸石を空から落とせ」と命じたとき、システムは、ほとんどキャンバス上に何も定義されていない状況にも関わらず「空」が何であるかを尋ね返してこなかった。システムは画面の上部から丸石を落としただけでなく、通常の物体のように落下速度を加速させた。これは、他の用途や状況から「落下」と「空」が何を意味するかを最もうまく推測できたからだ。

画像クレジット:OpenAI

数年前に、博士論文のために今回のシステムの機能限定版を作成していたザレンバ氏は、マイクロソフトワード用のCodexプラグインのデモを行いながら「これは、既存のソフトウェアと対話するための新しい方法を提供すると思います」と語った。もちろん、ワードプロセッサの多くのタスクは自動されているが、たとえば奇妙なフォーマットの問題が発生して、100カ所以上の異なる場所を修正したくなった場合はどうだろうか?「すべてのテキストを同じサイズとフォントにして、ダブルスペースをシングルにせよ」と入力すると、迷子になったスタイルを削除し「通常」と見なされる可能性が最も高いサイズとフォントを選択するのだ。そして「すべての見出しを24ポイントで太字にせよ」と入力すると、猛然と処理をこなしてくれるというわけだ。

ここで注意しておきたいのは、この種のことは多くの人にとって便利なことには違いないが、身体障がいなどのためにこれらのことを行えない人にとっては非常に重要だということだ。音声コマンドまたはジョイスティックを使用してワードプロセッサを操作している場合には、上記のような複雑なタスクを実行できれば非常に役立つ。盲目のコーダーは、他の人と同じように、標準のパブリックテストサーバーにパッチを適用できるが、Stack Overflowを探すこと、最適なコード断片の取得、構文の確認、関連する変数の変更などのプロセスは、ほぼ確実に長くなる。

そして、上から指示された構文や慣習の範囲内で作業する人にとっては、ドキュメントをモデルに与えることで、簡単にCodexがそれらを反映するようにすることができる。Codexは、コードをある言語から別の言語に変換して移植することもできる。これは、翻訳エンジンがスペイン語をフランス語に変換するのとほぼ同じやりかただ。

ブロックマン氏は、GPT-3の場合と同様に、これらは可能なことのほんの一部に過ぎず、開発者が思いつくものに驚かされることを望んでいるという(実際、OpenAIはAI Dungeon[AIダンジョン]の登場は予測していなかった)。ベータ版はGPT-3のベータ版と同様に非公開のものとなるが、開発者は自分のプロジェクトを説明して利用を申請することができる。Codexチームがその申請をレビューして招待を決めることになる。最終的にこのAPIは有料の公開APIになる予定だが、そのタイミングと価格はまだ決定されていない。

関連記事
GitHubがコーディングの提案を行う新しいAIツールをプレビュー
人間が操り理解できる大型AIの条件を探るOpenAIメンバーが創設したAI研究機関「Anthropic」
OpenAIの約109億円スタートアップファンドはマイクロソフトがパートナー

カテゴリー:人工知能・AI
タグ:OpenAIベータ版GPT-3コーディングノーコード

画像クレジット:OpenAI

原文へ

(文: Devin Coldewey、翻訳:sako)

より良い選択を学ぶオートコンプリートで誰でも文章を早くかけるようになるCompose.ai、企業独自の言葉遣いにも対応

今日のGPT-3の世界では、テキストを扱う新しいソフトウェアサービス話題になることも、珍しくなくなった。Compose.aiもそんな企業の1つで、同社は独自の言語モデルを開発し、多くの人が文章をもっと早く書けるようにしてくれる。初期のプロダクトが早くも投資家の関心を引き、Craft Venturesがリードするシードラウンドで210万ドル(約2億3000万円)を調達したことを同社は米国時間6月8日の朝に発表した。

関連記事:Copy.aiのAI利用記事作成システムは「使える」レベルの驚異的な出来、日本語も対応

Compose.aiは、ウェブを閲覧しているときにどこでも使えるオートコンプリート機能を提供する。AIを搭載したバックエンドは、ユーザーの声を学習し、コンテキスト(文脈)を吸収してより良い回答を提供したり、やがては企業の大きな声を吸収して文章のアウトプットを整える機能も備えている。

共同創業者のLandon Sanford(ランドン・サンフォード)氏とMichael Shuffett(マイケル・シャフェット)氏によると、Compose.aiは、5年後に平均的な人たちは書くときにすべてのワードをタイプしていない、と信じている。同社は、Compose.aiのChromeエクステンションで今後はもっと多くの人たちがそうなって欲しい、と述べている。ブラウザーのエクステンションなら、会社の許可がなくても使えるはずだ、と。

サンフォード氏とシャフェット氏の説明によると、同社の言語アルゴリズムはマルチティアのプロダクトだ。最初の段階として、インターネットそのものを読んで学習(主に英語)し、第2段階として具体的なドメイン、たとえばeメールというドメインを扱う。第3段階にはユーザーの声を学習し、そして今後の第4段階では、企業内で一般化している言語へのアプローチ、すなわちその企業独自の言葉遣いのパターンなどを扱う。

企業が従業員に共有言語モデルを提供することで、彼らが文章を書く際に言語や単語選択の好みを提示できるというのは興味深いコンセプトだ。このように強力で中央集権的なトーンという考え方は、役に立つものと知的に厳格なものの中間に位置する。しかし、多くの人は書くことに自分なりの工夫をしたくない、もしくは書くことをまったく好まないものだ。したがって、中央集権的なサポートを増やすことは、ほとんどの人にとって面倒なことではなく、むしろ時間を節約するハックになるだろう。

いずれにしてもCompose.aiは、新たに得た資金でスタッフを増やそうとしている。現在、フルタイムが3名と若干の契約社員だけだ。サンフォード氏とシャフェット氏によると、今後も小さな会社を維持し、少数の経験豊富な技術者と機械学習のスタッフでプロダクトチームを充実させたいという。

Composeの今後、どのような展開を行うのだろうか?創業者たちはTechCrunchに対し、少しずつ企業との対話を始めており、第4四半期末には有料サービスを開始する予定だと語った。これは早期の収益を意味し、スタートアップのランウェイを大幅に延長することになるだろう。

Composeが構築しているものは技術的にシンプルなものではなく、経済性を適切に調整するための興味深い作業が待っている。同社の創業者はTechCrunchに対し、同社のプロダクトが顧客のために実行するパーソナライゼーションの作業は、間違ったやり方をすると高くつく可能性があると述べている。2人は、将来的に月額10ドル(約1100円)のプランを経済的に魅力的なものにすることは可能だが、「ナイーブ」な方法で行えば、Compose.aiは同じアカウントをサポートするために500ドル(約5万4800円)の計算コストを費やす可能性があるという。

それはまずい。

同社は、間近に迫った有料プランが経済的にうまくいくと確信している。TechCrunchでは、機会があればそのバージョンの同社プロダクトを試してみたいと思っている。

関連記事
機械学習を活用してマーケッターのコンテンツ制作を自動化するSimplified
マイクロソフトはGPT-3を使い自然言語でコードを書けるようにする

カテゴリー:人工知能・AI
タグ:GPT-3機械学習Compose.ai資金調達文章

画像クレジット:danijelala/Getty Images

原文へ

(文:Alex Wilhelm、翻訳:Hiroshi Iwatani)

機械学習を活用してマーケッターのコンテンツ制作を自動化するSimplified

マーケティングに特化してCanvaに対抗しようとしているデザインソフトウェアのSimplifiedが、Craft Venturesが主導するシードラウンドで220万ドル(約2億4000万円)を調達した。このラウンドには他にSuperhumanのRahul Vohra(ラフル・ボーラ)氏とTodd Goldberg(トッド・ゴールドバーグ)氏、UberのCPOだったManik Gupta(マニック・グプタ)氏、Roomie創業者でPelican VenturesのAjay Yadav(アジェイ・ヤダブ)氏、Form Capital、8Bit Capital、Early Grey Capital、GFR Fund、MyAsia VCなども参加した。

Simplifiedは幅広いチャネルに向けて大量のコンテンツを作る必要に迫られているマーケッターをまさにターゲットにしている。このプラットフォームは機械学習を利用して、コピー、画像、フォーマット、サイズ調整などコンテンツ制作のプロセスを可能な限り自動化する。

例えばマーケッターがソーシャルメディアに心を動かすような引用を投稿したいとする。ソーシャルメディア向けのコンテンツであることを指定し、心を動かすような引用を見つけて、システムに対して適切な背景を自動で作るように指示する。その後はタイプフェイスや画像のトリミングなど何でも好きなように微調整すれば、すぐに公開できる。

画像クレジット:Simplified

Simplifiedは組織全体で作品やアセットを共有する共同作業ツールも提供している。ストックフォトやストックビデオのサービスとも統合できる。

Canvaなどの製品ですでに単純化されているプロセスを、機械学習とGPT-3を利用して次のレベルへ引き上げるのが、この製品の基本的な考え方だ。

創業者のKD Deshpande(KD・デシュパンデ)氏は、とにかくスケールが重要だという。コンテンツを1つだけ作るのがこれまでより簡単になったとしても、量の問題は残る。Simplifiedは機械学習の自動化アルゴリズムを活用してコンテンツ制作のプロセスをスピードアップすることを目指している。

Simplifiedは、ここ数年デザイン分野が大幅に進化している中で登場した。InVisionやFigma、Canvaなどが、新世代のデザイナーやデザイン指向組織の要求に合う新鮮なデザインツールを提供して進化を引っぱっている。

カテゴリー:ソフトウェア
タグ:Simplified資金調達機械学習マーケティングGPT-3デザイン

画像クレジット:Simplified

原文へ

(文:Jordan Crook、翻訳:Kaori Koyama)