AI翻訳機「ポケトーク」が音声を翻訳し本体とウェブブラウザーに文字表示を行う「ハンズフリー翻訳(β版)」を新搭載

AI翻訳機「ポケトーク」が音声を翻訳し本体とウェブブラウザーに文字表示を行う「ハンズフリー翻訳(β版)」を新搭載

©SOURCENEXT CORPORATION

AI(人工知能)翻訳機の「ポケトーク」を手がけるソースネクストは、「ポケトーク W」、「ポケトーク S」、「ポケトーク S Plus」に「ハンズフリー翻訳(β版)」を追加しました。

ハンズフリー翻訳(β版)は、リアルタイムでポケトークから音声をクラウドサーバに送り、クラウドサーバから翻訳結果をポケトーク本体や専用サイトに配信する仕組みです。専用サイトのURLやパスワードなどを相手に伝えることで、翻訳内容を共有することも可能です。

同社によると、技術的な内容の詳細については非公開とのことですが、Web会議やスピーチだけでなく、外国語のテレビやラジオなどを聞きながら日本語で意味を確認したりといったことにも活用できるそうです。

記者が実際に使用してみたところ、発話が終わってから翻訳結果が表示されるまでのタイムラグが短く感じられました。

注意点としては保存形式が限られること。現時点ではCSV形式でのみ保存できますが、個人的にはテキスト形式での保存にも対応してほしかったです。とはいえ、専用サイトに表示される翻訳結果をコピーして、パソコン向けのテキストエディタに貼り付けて保存できるため、この点についてはユーザー側の工夫次第といえそうです。

なお、ハンズフリー翻訳(β版)の利用にはWi-Fi環境が必要です。利用料は無料で、対象端末をアップデートするだけで利用できるようになります。対応言語は日本語や英語、中国語などを含む82言語。ちなみにこれは、音声認識が可能な言語数で、現在、ポケトークで対応している全言語になります。

名刺大の翻訳機「POCKETALK S」が12月発売、カメラでテキスト翻訳も
約3万円の大型通訳機 POCKETALK S Plus 発表。eSIM内蔵でどこでも訳す

(Source:ソースネクストEngadget日本版より転載)

関連記事

JapanTaxiのタブレット端末に世界74言語の通訳機能が追加、ソースネクストと業務提携
AI利用のリアルタイム英語音声文字起こし「Otter. ai」とNTTドコモが日本向け法人プラン独占販売契約
議事録自動作成用AIツール26種類をまとめた「議事録作成AIカオスマップ」が公開
マイクロソフトが会議で文字起こしや翻訳を行うアプリ「Group Transcribe」を発表
プロの翻訳者に匹敵するAI翻訳サービスを提供するLengoo、新ラウンドで約21億円を獲得
アマゾンがEchoデバイスを使った「ライブ翻訳」機能をローンチ
翻訳アプリのReversoがデスクトップ版をリリース、文書翻訳や企業内サイト翻訳など事業も拡大中
双方向同時通訳可能な新型ウェアラブル翻訳機が4月に約2.2万円で発売へ
グーグルのリアルタイム翻訳ツールがスマホにも登場

カテゴリー:人工知能・AI
タグ:音声認識 / Voice Recognition(用語)ガジェット(用語)機械翻訳(用語)ソースネクスト(企業)ポケトーク(製品・サービス)日本(国・地域)

AIを中心とするプロセス・オートメーション・プラットフォームのDeepSee.aiが24.7億円のシリーズA調達

米国時間3月15日、企業がAIを利用して基幹業務の課題を自動化することを支援するスタートアップ企業のDeepSee.ai(ディープシーAI)が、ForgePoint Capitalの主導する2260万ドル(約24億7000万円)のシリーズAラウンドを実施したことを発表した。今回のラウンドには、前回の投資家であるAllegisCyber CapitalとSignal Peak Venturesも参加していて、ソルトレイクシティを拠点とするDeepSee.aiのこれまでの資金調達総額は3070万ドル(約33億5000万円)に達した。

同社は、これまでとは異なるプロセスオートメーションを、企業に対して提供するのだという。最近の業界のバズワードといえば「ロボティック・プロセス・オートメーション」(RPA)だが、DeepSee.aiはその内容が異なると主張している。私はそのシステムを「ナレッジ・プロセス・オートメーション」(KPA)と形容している。同社自身はこれを「非構造化データを採掘し、AIを活用した知見を運用し、結果を企業のリアルタイムアクションへと自動適用する」システムだと定義している。そして同社はまた、現在世の中で提供されているようなロボットは基本的なタスクの自動化に重点を置いており、高度な機械学習モデルがもたらせるような深い洞察は提供できていないと主張している。また同社は、このシステムがナレッジワーカーの置き換えを目指すものではなく、企業が収集する膨大なデータを実用的な洞察に返還する手助けをAIを活用して行うことを目指すのだと強調している。

画像クレジット:DeepSee.ai

DeepSee.aiのCEOであるSteve Shillingford(スティーブ・シリングフォード)氏は「経営者のみなさまは、科学的なプロジェクトではなく、ビジネス上の成果が必要なのだとおっしゃいます」と書いている。「そして現在、大企業の中でのAIを中心にした展開の多くで、急増している不満は、それらが理論的にはすばらしいものでありながら、本番ではほとんど失敗するということなのです。私たちはその理由を、現在の『AIアプローチ』には全体的なビジネスコンテキストへの関連性が欠けているからだと考えています。思慮に欠け、硬直していて、現場の専門家の文脈に沿った意見も取り入れられていません。私たちは、強力なテクノロジーと基幹業務の間のギャップを、適用可能なソリューションでつなぐために、DeepSeeを創業致しました。そのソリューションをお使いいただくことで、お客さにAIを活用した自動プロセスを運用していただくことが可能になります。すなわちより速く、より良く、そしてより安価な結果がもたらされるのです」。

DeepSee.aiは、顧客企業がそのプラットフォームを使い始めることができるように、3つのコアツールを提供している。まず、構造化されていないデータを取り込み、ラベリング、モデルレビュー、そして分析の準備を行うDeepSee Assembler(ディープシー・アセンブラー)がある。その後、DeepSee Atlas(ディープシー・アトラス)がこのデータを使用して、企業のビジネスプロセスを理解できるAIモデルを訓練する。そして対象業務の専門家が、企業の内部プロセスを自動化するためのテンプレート、ルール、ロジックを定義する手助けを行う。そして、それらとは並行して、企業がビジネスプロセスをよりよく理解し評価することができるように、3つ目のツールであるDeepSee Advisor(ディープシー・アドバイザー)がテキスト分析に焦点を当てる。

現在、同社はこれらのツールを保険会社、公共事業関係、資本市場に提供することに重点を置いている。たとえば保険分野では不正行為の検知、保険請求の予測と処理、大量の非構造化データを利用して代理店監査のためのパターンを特定するといったユースケースがある。

これは1つのスタートアップとしては比較的限られた数の業界だが、同社は今回の資金調達で製品開発を加速させ、新たな業界にも進出していくと語る。

ForgePoint CapitalのマネージングディレクターであるSean Cunningham(ショーン・カニンガム)氏は「KPAを使うことで、基幹業務の責任者の皆さまは、データサイエンスと企業の成果を結びつけ、AI / ML(人工知能 / 機械学習)を活用した自動化を大規模に運用し、予測的な洞察をリアルタイムに利用して収益の拡大、コストの削減、リスクの軽減を図ることができるのです」と語る。「ForgePointは、一流のサイバーセキュリティ投資家として、インサイダーの脅威、データの可視化、コンプライアンスといった、セキュリティに関わる日々の課題を認識しています。今回のDeepSeeへの投資は、ビジネスオートメーションのリスクを低減させる能力を加速させ、お客さまたちが実装に必要となさるAIの透明性を実現します」。

カテゴリー:人工知能・AI
タグ:DeepSee.aiRPA資金調達

画像クレジット:Nigel Sussman

原文へ

(文:Frederic Lardinois、翻訳:sako)

Preferred NetworksがCrypkoを含む深層学習活用のデジタル素材生成システムをクリエイティブ産業向けに開発

 

Preferred Networksが深層学習活用のデジタル素材生成システムをクリエイティブ産業向けに開発

Crypkoで自動生成したキャラクターの例

Preferred Networks(プリファードネットワークス。PFN)は3月10日、クリエイティブ産業向けとして、好みのキャラクターや高精細な3Dモデルを生成できるデジタル素材生成システムを発表した。

また同システムを利用した映像作品の第1弾として、PFNは、バーチャルシンガーHACHI(RK Music所属)の楽曲「20」をフィーチャーした短編動画(企画・制作:PFN、キングレコード、ポリゴン・ピクチュアズ)を公開した。

キャラクターの自動生成を行う「Crypko」(クリプコ)

同デジタル素材自動生成システムは、キャラクターの自動生成を行うプラットフォーム「Crypko」(クリプコ)、「高精細3Dモデル生成」の2機能で構成している。

Crypkoは深層学習を利用し、制作者が定義した顔のパーツ、表情、髪の色などに合ったキャラクターのCG(立ち絵)を自動生成可能。これまでCrypkoは顔を生成対象としていたが、より高い解像度で上半身まで生成可能となった。

高精細3Dモデル生成

高精細3Dモデル生成機能では、実物のアイテムを専用3Dスキャナーに配置し撮影するだけで、高精細な3Dモデルを自動生成できる。様々な材質や大きさの被写体に対応しており、小型アイテムであれば、約6時間の撮影作業で当日中に200点以上の3Dモデル化が可能という。生成した高精細3Dモデルは市販の編集ソフトで自由に加工・複製し、映像作品やゲームなどで使用できる。

Preferred Networksが深層学習活用のデジタル素材生成システムをクリエイティブ産業向けに開発

実物の写真

 

Preferred Networksが深層学習活用のデジタル素材生成システムをクリエイティブ産業向けに開発

3Dスキャンで生成した高精細モデル

 

Preferred Networksが深層学習活用のデジタル素材生成システムをクリエイティブ産業向けに開発

回転させた3Dモデル(低解像度)

 

3Dモデルのメッシュ構造

3Dモデルのメッシュ構造

映像作品の第1弾で、主人公キャラクターやアイテム類の制作に利用

PFNが公開した短編動画では、キャラクター自動生成システムが生成したキャラクターを基に主人公のデザインを行ったほか、スマートフォンや背景の文房具などのアイテムは高精細3Dモデル生成機能を用いて実物から生成したデータを基にしているという。

また、動画に登場するギターのCG制作過程では細部の質を上げるため外部クリエイターと共同作業しており、精細なデジタル素材を作成できたとしている。

Preferred Networksが深層学習活用のデジタル素材生成システムをクリエイティブ産業向けに開発

短編動画で使われたギターと家具の3D CG

なお、同デジタル素材自動生成システムは、経済産業省の令和元年度補正予算「コンテンツグローバル需要創出促進・基盤整備事業費補助金」(J-LOD)第4弾の採択事業として開発したもの。

同システムをはじめとして、PFNは今後もクリエイティブ産業向けに先端技術を活用した制作手法を提案し、新しい表現・体験の実現を目指すとしている。

関連記事
KDDIがバーチャル人間「coh」発表、5Gの超低遅延技術を活用したリアルタイムクラウドレンダリング採用
リコーが3Dコンテンツを全方位立体映像として現実空間に映し出せる投影装置を開発、裸眼で視認可能
高さ2mの65型有機ELディスプレイで等身大のAIキャラによる接客実現、Gateboxが法人向け大型召喚装置
Epic Gamesが超リアルなキャラを柔軟に制作できるUnreal Engineの3Dツール「MetaHuman」披露
フォトリアルな3D CGによるバーチャルヒューマンのプロデュースを展開するAwwが1億円を調達

Preferred Networksと鹿島建設が建築現場用ロボ向けAI搭載自律移動システム開発、GNSS計測不可の屋内も対応
Preferred NetworksがAI・高度IT人材育成に向け機械学習・深層学習コンテンツ4種を公開
Preferred Networksが教育事業第2弾、子ども向けタイピング練習ウェブアプリのベータ版
トヨタがAIスタートアップのPreferred Networksと提携 支援サービスロボット開発へ
Preferred Networksが中外製薬と東京エレクトロンから9億円を調達、深層学習技術を用いた共同研究へ
乳がんの早期発見精度を99%以上に向上させた、日本発のAI開発スタートアップ

カテゴリー:人工知能・AI
タグ:アニメーション(用語)AI / 人工知能(用語)Crypko(製品・サービス)ディープラーニング / 深層学習(用語)Preferred Networks(企業)
日本(国・地域)

AI利用の雇用市場分析でイスラエルのRetrain.aiが約14億円調達

イスラエルを拠点とするretrain.aiは、AI(人工知能)とマシンラーニングを利用して求人掲示を大量に調査し雇用市場の動向を分析しているが、今回はSquare Peg率いるシリーズAでは900万ドル(約9億8000万円)を調達した。2020年の400万ドル(約4億3000万円)のシードラウンドは未発表(Hetz Venturesが主導し、TechAvivと.406 Venturesが参加)だったため、retrain.aiは合計1300万ドル(約14億円)を調達したことになる。ライバルには5660万ドル(約61億円)を調達したPymetricsや、1億7680万ドル(約190億円)を調達したEightfold.aiなどがある。

今回の資金調達に加えて、retrain.aiはイスラエル労働省との間で最初の契約を結び、パンデミックにより変化する同国の雇用市場の変化について調査を行う契約を結んだ。

テクノロジーが従来の労働市場を侵食する中、retrain.aiのプラットフォームはどのような仕事が広告されているか、あるいはどのような仕事の人気が下がっているかを調べ、新しい仕事がどこから現れるのかを早期に警告できるという。これは、大規模な組織や政府の政策形成に役立つ。

retrain.aiのCEOはShay David(シェイ・デイビッド)博士で、同氏はビデオエンタープライズのリーダーであるKalturaを共同設立したことで知られており、2007年にはTehcCrunch初のカンファレンスにも登壇した。COO(最高執行責任者)にはIsabelle Bichler-Eliasaf(イザベル・ビヒラー・エリアサフ)氏、CTO(最高技術責任者)にはAvi Simon(アヴィ・サイモン)氏が就任している。

デイビッド博士は「かつては労働力の定期的な変化が大きな流れに発展し、特に新型コロナウイルスがその労働市場への大きな影響を顕著に示し、警鐘となりました。失業と不完全雇用は、今後数十年のうちに世界中で10億人もの人々に影響を及ぼすでしょう。私たちのビジョンは、2025年までに1000万人の従業員が適切な職に就けるよう支援し、組織が変化の波の中を効率的に進むのを支援することです」と述べた。

retrain.aiは、Square Pegによる4億5000万ドル(約490億円)規模の新ファンドによる最初の投資となる。同VCはこれまでにCanvaやStripe、Fiverr、Airwallexに投資していた。

カテゴリー:人工知能・AI
タグ:retrain.ai機械学習資金調達

原文へ

(文:Mike Butcher、翻訳:塚本直樹 / Twitter

議事録自動作成用AIツール26種類をまとめた「議事録作成AIカオスマップ」が公開

議事録自動作成用AIツール26種類をまとめた「議事録作成AIカオスマップ」が公開

人工知能(AI)を搭載したサービスの資料請求ができるAIポータルメディア「AIsmiley」を運営するアイスマイリーは3月8日、議事録自動作成用AIツールをまとめた「議事録作成AIカオスマップ」を公開した。掲載数は合計26サービス。

議事録自動作成用AIツールは、時間と労力がかかる議事録の文字起こしを、AIが代行してくれるというもの。AIが人の声を認識してテキストデータ化したり、複数の言語間を自動的に翻訳しテキスト化するといった技術の導入が進んでいる。

録音された音声を聞きながら文章として構成するのは楽な作業ではなく、場合によっては聞き間違いや聞き漏らしなどのミスも発生する。

間違いの修正など時間のロスを最小限に留め、より効率的に議事録を作成するための方法として最近注目されているのが、音声認識機能を活用した議事録自動作成のAIツールという。

ただ議事録作成AIには、ツールによって機能や実現できる内容に違いがあり、自社の課題は何か、どんな結果を実現したいのかという観点から、ツールごとの違いを比較検討することが重要としている。

また、議事録作成AIは、録音した音声から文字起こしを行うものと、リアルタイムで音声の文字起こしをするもの、日本語のみ対応・多言語対応といった違いもある。活用シーンによって選択すべきツールも異なるそうだ。

議事録作成AIカオスマップは、「議事録作成AIを試したい」企業や「議事録作成を行う最新のAIツールを探している」企業に向け、26の製品サービスを取りまとめ、マッピングしたもの。「大サイズの議事録作成AIカオスマップ(PDF)」と「議事録作成AIベンダー一覧(Excel)」が必要な場合は、問い合わせフォームから連絡することで入手できる。

関連記事
マイクロソフトが会議で文字起こしや翻訳を行うアプリ「Group Transcribe」を発表
現場状況を遠隔地と共有可能な「コネクテッドワーカーソリューション」のフェアリーデバイセズが10.2億円調達
アマゾンがEchoデバイスを使った「ライブ翻訳」機能をローンチ
LINEがOpenAI「GPT」・Google「T5」同様の超巨大汎用言語モデルをNAVERと共同開発、世界初の日本語特化
日本語に特化したAI文字起こしサービス「Rimo Voice」が登場、1時間の保存音声を最短5分でテキスト化
発言者ごとの文字起こし・議事録作成可能な「Sloos」がマイクロソフトの法人向けアプリストアで提供開始
マイクロソフトやアマゾンが音声認識チップの新興メーカーSyntiantに出資
会議や講演の音声をAIで自動的に文字起こしする「Smart書記」が8500万円を調達
AIを使った音声テキスト変換アプリOtterがNTTドコモなどから戦略的投資10億円獲得

カテゴリー:人工知能・AI
タグ:アクセシビリティ(用語)AI / 人工知能(用語)音声認識 / Voice Recognition(用語)カオスマップ(用語)機械翻訳(用語)自然言語処理(用語)文字起こし / Transcribe(用語)日本(国・地域)

プロの翻訳者に匹敵するAI翻訳サービスを提供するLengoo、新ラウンドで約21億円を獲得

AIベースの翻訳ツールを使用する人のほとんどは、1つのフレーズや引用文を理解するなど、一般的で比較的重要ではないタスクに利用している。技術文書を15の言語で提供しているような企業にはそのような基本的なサービスは適さないが、Lengoo(レングー)のカスタム機械翻訳モデルなら役に立つかもしれない。Bラウンドで新たに2000万ドル(約21億円)を調達した同社は、多数の見込み顧客を獲得できる可能性がある。

翻訳ビジネスは数十億ドルの規模を誇り、今後も存続が見込まれる。ごく一般的なものとしては、ドキュメント、ソフトウェア、または稼働中のウェブサイトを複数の言語(場合によっては数十言語)でリリースする作業が挙げられる。

このような作業は現在翻訳会社が行っており、専門家によるオンデマンドで質の高い翻訳を提供している。日常的なツールとしての機械翻訳の台頭は、世間が思っているほどには翻訳者の仕事に影響を与えていない。韓国のウェブサイトでポルトガル人ユーザーがGoogle(グーグル)のビルトインウェブページ翻訳を使うのはニッチなケースで、ソーシャルメディアの投稿や個人的な文章の翻訳などは専門家に外注するほどのものではないと言えるだろう。

こうした場合、最低限の意味がわかれば人々の望みやニーズは満たされるため、「まあまあのレベル」で満足するというのが法則となっている。しかし、10の異なる市場で10種類の言語を使用する製品をリリースする場合はそれでは不十分だ。説明書、警告文、契約書、技術文書などを、1つの言語では完璧に仕上げて、ほかの9言語はまあまあのレベルで提供するわけにはいかない。

レングーは、企業と翻訳者間のワークフローの自動化に取り組むチームからスタートした。

CEO兼創設者のChristopher Kränzler(クリストファー・クランツラー)氏は、「次のステップは明らかに翻訳そのものを自動化することでした。今後も当分の間、人間が行う作業は必要なままでしょう。目標は、人間による翻訳作業を減らすことができるよう、真に実用的なレベルにまでモデルの性能を引き上げることです」と語っている。

機械学習の機能は継続的に向上しているため、その目標は決して非現実的ではない。 DeepL(ディープエル)やLilt(リルト)などの他社も同じ目標に向かっている。こうした企業はグーグルやMicrosoft(マイクロソフト)のフレームワークを上回る品質向上を実現したが、翻訳プロセスから人間による作業を無くすとは決して主張していない。

レングーは、スピードと特定性、つまり、特定のクライアントのすべての専門用語、スタイル、書式設定、必要なフォーマットを統合することにフォーカスしている。そのため言語モデルのトレーニングに、顧客独自のドキュメントやウェブサイトだけでなく翻訳プロセスからのフィードバックを継続的に取り入れてカスタマイズしている。

モデルの自己改善プロセスのイメージ。画像:レングー

「当社には、モデル用の自動化されたトレーニングパイプラインがあります。人間がプロセスに修正を加えるほど、プロセスは速くなっていきます。最終的にはグーグルやディープエルの約3倍の速さになるでしょう」とクランツラー氏は言う。

新しいクライアントは、過去数年間の数千に及ぶドキュメントでカスタマイズされたモデルから開始できる。しかし、モデルが生成したテキストに修正が必要になるたびに、その修正を記憶し、他のトレーニングと一緒に統合していく。

30回のイテレーションの後、修正を必要としない文節は倍増しており、修正を少ししか必要としない文節も大幅に増加していることを示す、非常に興味深いグラフ。画像:レングー

 翻訳の「品質」を客観的に定量化することは難しい。しかしこの場合は問題なく定量化できる。人間の翻訳者が使用するツールとして機能していることは、品質チェック機能が組み込まれていることを意味する。翻訳の質の高さは、基本的にモデルが提示したテキストに対して人間がどれだけ変更を加えなければならないかを示す「補正距離」によって測定できる。修正が少ないということは、より質の高い翻訳であるだけでなく、より速いということでもあり、品質とスピードの両方に客観的な基準があることを意味する。

これらの改善は、これまで行き過ぎた自動化を懸念していた顧客にも受け入れられた。

クランツラー氏は「「最初は抵抗が見られました」と認めながらも、次のように語っている。「人々は普段の翻訳をグーグル翻訳に頼り、その品質が向上していくのを目にしています。グーグル翻訳やディープエルが市場を啓蒙し続けてきたのは事実です。今や人々は、正しく使えば専門的な用途でも機械翻訳が機能することを理解しています。大手顧客は30人、40人、50人もの翻訳者を抱えていて、それぞれ独自のスタイルを持っています。しかし私たちは、翻訳の速度とコスト効率を上げることができ、一貫性という点で品質の向上にも貢献できます。」

クライアントのデータを使ってモデルをカスタマイズすることは独自のアプローチとは言えないが、レングーは競合他社や、製品開発に遅れをとっている大企業に先んじているようだ。そして同社は、技術スタックを刷新することで、業界をけん引する立場に留まることを目指している。

課題としては、事実上、伝統的な機械学習技術に依存しているため、肝心な翻訳者とAI間のフィードバックループが制限されていることだ。モデルがどれだけ早くアップデートされるかはそのモデルの使用回数に依存するが、数百語相当のコンテンツを統合するためだけに大規模なモデルを再トレーニングすることは求められないだろう。再トレーニングにはコストがかかるため、頻繁に実行することはできない。

しかしレングーは、さまざまなパイプラインやプロセスを統合した、より応答性の高い独自のニューラルマシン翻訳フレームワークの構築を計画している。結果がリアルタイムで改善されるわけでないが、最新の情報をより迅速かつ手間の少ない方法で取り込むことができる。

応用研究責任者のAhmad Taie(アーマッド・タイエ)氏は、「文節ごとの改善と考えてください」と説明する。文節のサイズはさまざまだが、一般的にはテキストの論理的なまとまりである。「1つの文節を翻訳すると、次の文節に取り掛かるまでにモデルが改善されます。」

もちろん、顧客ごとに主力製品の機能を改善し、速度を上げ、実装しやすくしていくことが顧客をつなぎとめる重要なポイントである。業界内の競争は激しくなると見込まれるが、クランツラー氏は、グーグルやその他の既存の大企業が競争に参入する見込みはないと考えている。そうした企業は、アジャイル開発のアプローチよりも、買収によって統合するアプローチを好むためだ。

人間の翻訳専門家について言えば、機械翻訳は翻訳者に取って代わるものではなく、その効率を、最終的にはけた違いに高めるものとなる。効率化が進むことによって労働需要が縮小する可能性は考えられる。しかし、国際市場が拡大を続け、それに伴って専門的な翻訳へのニーズも増えれば、需要を維持できるかもしれない。

Inkef Capital(インケフキャピタル)のリードによる2000万ドル(約21億円)のラウンドで、レングーは北米市場だけでなくヨーロッパ内の新しい市場にも進出し、より多くのエンタープライズスタックと統合できるようになる。既存の投資家であるRedalpine(レッドアルパイン)、Creathor Ventures(クリエソー ベンチャーズ)、Techstars(テックスターズ、同社の設立したプログラムから参加)、エンジェル投資家のMatthias Hilpert(マティアス・ヒルパート)氏とMichael Schmitt(マイケル・シュミット)氏、そして新たにPolipo Ventures(ポリポ ベンチャーズ)とVolker Pyrtek(フォルカー・ピルテック)氏もこのラウンドに参加している。

関連記事:アマゾンがEchoデバイスを使った「ライブ翻訳」機能をローンチ

カテゴリー:人工知能 / AI
タグ:機械翻訳 資金調達

[原文へ]

(文:Devin Coldewey、翻訳:Dragonfly)

顔交換も簡単にできる中国のマシン動画生成スタートアップSurrealが創業3カ月で資金調達

もし動画を作るためのカメラが不要になり、数行のコーディングで動画を生成できるようになったとしたらどうだろう?

機械学習の進歩が、そのアイデアを現実のものにしつつある。私たちも、ディープフェイク技術が家族写真で顔を入れ替えたり、自撮りを有名なビデオクリップに変えたりする例を見てきた。現在、AI研究のバックグラウンドを持つ起業家たちが、アルゴリズムを使って超リアルな写真や音声、動画を生成するためのツールを考案している最中だ。

関連記事
MyHeritageが古い家族写真をディープフェイク技術でアニメーション化
口コミで大流行の顔交換ビデオアプリRefaceにa16zなどの有名投資会社が約6億円を出資

こうした技術を開発しているスタートアップの1つが、中国に拠点を置くSurreal(サーリアル)だ。同社は設立からわずか3カ月しか経っていないが、Sequoia ChinaとZhenFundという2つの著名な投資家からすでに、シードラウンドで200万~300万ドル(約2億1000万〜3億2000万円)の資金を調達している。創業者でCEOのXu Zhuo(シュウ・チョウ)氏はTechCrunchに対して、Surrealは今回のラウンドで10件近くの投資オファーを受けたと語っている。

Surrealを創業する前、シュウ氏はSnap(スナップ)に6年間在籍していて、同アプリの広告レコメンデーションシステム、機械学習プラットフォーム、AIカメラ技術の開発に携わっていた。この経験はシュウ氏に、合成メディアが主流になると確信させた。なぜならそのツールは「コンテンツ制作のコストを大幅に下げることができる」からだと、シュウ氏は、深圳(シンセン)にある Surreal社の十数人規模のオフィスで行われたインタビューで語っている。

とはいえ、Surrealには、人間のクリエイターやアーティストを置き換えようという意図はない。実際、シュウ氏は、今後数十年の間に機械が人間の創造性を超えることはないと考えているのだ。この信念を体現しているのが、同社の中国名である「诗云」(シーユン、詩雲)だ。これは、SF作家の劉慈欣(リュウ・ジキン)氏の小説のタイトルから取られたもので、その小説は技術が古代中国の詩人李白に勝てないという物語だ。

「私たちの方程式は『視覚的なストーリーテリングは、創造性プラス制作力に等しい』というものです」とシュウ氏は目を輝かせながら語る。「私たちはその『制作力』の部分に注力しているのです」。

ある意味、マシン動画生成とは、Douyin(抖音、ドウイン、中国版TikTok)やKuaishou(快手、カイショウ)を人気の高いものにしたビデオフィルターを、ステップアップしたような強化版ビデオツールなのだ。既存のショートビデオアプリはプロ並みの動画を作るための障壁を大幅に下げてくれるものの、それでもカメラは必要だ。

「ショートビデオのキモは、決してショートビデオの形式そのものではありません。肝心な点はより良いカメラ技術を手に入れることができるかどうかです。これによってビデオ制作コストが下がります」とシュウ氏は語る。彼はSurrealを、TikTokの親会社ByteDance(バイトダンス)のベテランであるWang Liang(ワン・リエン)氏とともに設立した。

ディープフェイクの商品化

Google(グーグル)、Facebook(フェイスブック)、Tencent(テンセント)、ByteDanceなどの世界最大のテック企業の中にも、GAN(敵対的生成ネットワーク)に取り組んでいる研究チームがある。シュウ氏の戦略は、大型契約へと向かっている重量級のアプリとは直接対決しないことだ。むしろ、Surrealは中小の顧客を狙っている。

eコマース販売者向けのSurrealの顔交換ソフト

Surrealのソフトウェアは現在のところ企業顧客にのみ提供されていて、顧客はアップロードされたコンテンツの顔を変更したり、まったく新しい画像や動画を生成したりするために使用することができる。シュウ氏はSurrealを「動画用Google翻訳」と呼んでいる、なぜならそのソフトウェアは人間の顔を交換するだけでなく、登場人物が話す言語を同時に翻訳し、声と唇を一致させることができるからだ。

ユーザーは動画や画像ごとに課金される。今後、Surrealは顔だけでなく、人の服や動きをアニメーション化することも目指している。Surrealは財務状況の公表を拒んだが、シュウ氏によれば、同社は約1000万件の写真と動画の注文を受け付けたという。

現在、多くの需要があるのは、中国のeコマース輸出企業だ。彼らはマーケティング素材に西洋人のモデルを登場させるためにSurrealを使っている。本物の外国人モデルを雇うのはコストがかかるが、アジア人モデルを採用しても効果があるかどうかはわからない。Surrealの「モデル」を使用することで、一部の顧客は2倍の投資収益率(ROI)を達成することができたとシュウ氏はいう。数百万ドル(数億円)のシード資金を手にした Surreal は、アルゴリズムの改善のために大量のデータを収集できるように、オンライン教育などのより多くのユースケースを模索することを計画している。

未知の領域

Surrealを支えている技術は、敵対的生成ネットワーク(GAN)と呼ばれる比較的新しい技術だ。機械学習研究者の Ian Goodfellow(イアン・グッドフェロー)氏が2014年に発表したGANは、画像を生成する「ジェネレーター」と、画像が偽物(フェイク)か本物(リアル)かを判別する「ディスクリミネーター」のペアで構成されている。このペアは、ジェネレーターが満足のいく結果を出せるようになるまで、敵対的な役割として訓練を行う。

GANが悪意ある者の手に渡った場合には、詐欺やポルノなどの違法行為に利用される可能性がある。Surrealが個人ユーザーの利用ではなく、エンタープライズでの利用から始めている理由の一部はその点にある。

Surrealのような企業はまた、新たな法的課題を提起している。機械が生成した画像や動画の所有者は誰なのだろう?著作権を侵害しないようにするために、Surrealでは顧客に対して、アップロードするコンテンツに対して権利を持つことを求めている。誤用を追跡し防止するために、Surrealは生成したコンテンツの各部に暗号化された目に見えない透かしを追加し、所有権を主張する。Surreal が作成した「人物」がたまたま実在の人物と一致する可能性もあるため、同社は生成したすべての顔とオンラインで見つけた写真を照合するためのアルゴリズムを実行している。

「倫理問題に対してはSurreal自身が解決することはできないと思っていますが、私たちはこの問題を探求していきたいと思っています」とシュウ氏は語っている。「根本的に、(合成メディアは)ディスラプティブなインフラを提供すると思っています。それは生産性を高めます。生産性がこのような応用にとっての重要な決定要因となっているのですから、マクロレベルでは避けて通ることはできません」。

カテゴリー:人工知能・AI
タグ:SurrealGAN中国機械学習資金調達ディープフェイク

画像クレジット:Surreal

原文へ

(文:Rita Liao、翻訳:sako)

東京メトロがデプスカメラとAIを用いた列車混雑計測システム活用し混雑情報をリアルタイム提供

東京メトロがデプスカメラとAIを用いた列車混雑計測システム活用し列車混雑状況をリアルタイム提供

東京メトロは3月1日、デプスカメラと人工知能(AI)を用いた列車混雑計測システムを発表しました。これは上野グリーンソリューションズと共創による取り組みです。

同システムを利用することで、リアルタイムでの列車混雑状況を改札口や東京メトロのアプリやホームページで把握できるようになります。

これまで東京メトロでは、車重や改札利用者数から時間帯ごとの混雑状況を推計して混雑状況を提供していました。しかし同社は複数路線で相互直通運転を行っているため、リアルタイムな混雑状況を提供することは難しいのが実情でした。

東京メトロがデプスカメラとAIを用いた列車混雑計測システム活用し列車混雑状況をリアルタイム提供

デプスカメラは奥行きの情報を取得する深度センサーを内蔵したカメラで、1ホームに1台設置します。駅を出発する列車内の混雑状況を撮影し、映像から取得した深度情報をエッジサーバーでテキスト化して、クラウドサーバーに送信。クラウド上では人工知能がデータを分析・解析し、発車から十数秒で列車ごとの混雑状況を算出します。

2020年11月から丸ノ内線新宿駅で実証実験を行っており、技術検証が完了したため列車混雑計測システムを東京メトロ全線の複数駅に展開することになりました。2021年度を目途に全線の列車混雑状況をリアルタイムで乗客に提供することを目指すとしています。

(Source:東京メトロEngadget日本版より転載)

関連記事
ゲシピと東京メトロがeスポーツで業務提携、2020年度中にジム事業を開始予定
「東京の陳腐化を避けたい」東京メトロとスペースマーケットがシェアエコで沿線地域を盛り上げる

カテゴリー:人工知能・AI
タグ:AI / 人工知能(用語)東京メトロ / 東京地下鉄日本(国・地域)

AWSがML学習用カーレースDeepRacer Leagueの敷居を下げて新人を歓迎

AWSは2018年に、デベロッパーに機械学習を楽しく教える方法としてDeepRacer Leagueを立ち上げ、その後さまざまなアップデートを重ねてきた。米国時間3月1日、同社はOpenとProという2つの部門がある2021年の新しいリーグシーズンを発表した。

Marcia Villalba(マルシア・ビラルバ)氏が書いているこの新しいリーグを発表するブログの記事によると「AWS DeepRacerは1/18スケールの自動運転レースカーで、AWSのDeepRacerコンソールでバーチャルにレースをしたり、あるいはAWS自身や顧客のイベントでトラックを実際に走ったりして、強化学習のモデルをテストする。AWS DeepRacerはスキルレベルの高低に関わりなく楽しめるし、機械学習の経験のない人でもよい。AWS DeepRacerを利用して強化学習を勉強するときはAWS DeepRacer Leagueに加わり、競走を楽しみながら機械学習を体験する」。

同社は最初、1/18サイズの実際のクルマを人が操縦するレースを構想していたが、パンデミックのおかげで2020年はバーチャルなイベントになった。しかし、その新しいかたちは新人の参入を難しくしたようだ。目標は人びとに機械学習を教えることであるため、新人が気軽に参加できることが同社にとっても重要ではないか。

そこで同社が開発したのがオープンなリーグ、Open Leagueだ。その名のとおり誰に対してもオープンで、このリーグでは自分のスキルを試せるし、上位10%入賞の常連になったらPro Leagueで競走できる。賞もあるし、クルマをカスタマイズすることもできる。

各月のPro Leagueで16位以内になった人は、AWS re:Invent 2021で行われる決勝に出場できる。決勝もバーチャルになるかどうか、それはパンデミックからの回復次第だ。

関連記事:AWSが開発者向けの機械学習キーボード 「DeepComposer」 を発表

カテゴリー:人工知能・AI
タグ:AWS機械学習

画像クレジット:AWS

原文へ

(文:Ron Miller、翻訳:Hiroshi Iwatani)

MyHeritageはディープフェイク技で古い家族写真をアニメーションさせる

家系図サービスのMyHeritage(マイヘリテージ)は、本物らしい表情の操作や利用者の個人データ収集に、AI駆動の合成メディアを使い始めている。同社は、Deep Nostalgia(ディープ・ノスタルジア)という新機能をローンチした。人の写真をアップロードすると、アルゴリズムによってその顔をアニメーション化してくれるというものだ。

亡くなって久しい親戚や過去の偉人が合成近似化処理によって生き返り、どうしてこんな役立たずのデジタルフォトフレームの中に閉じ込められているのだと、目を動かし顔を傾ける様子には、ドラマ『ブラック・ミラー』ばりの引きがあるが、昨日(米国時間2月26日)に家族歴に関するカンファレンスで公開されると、当然のことながらソーシャルメディアで拡散された。

Dr Adam Rutherford「甦ったロザリンド・フランクリン」

Nathan Dylan Goodwin「MyHeritageのDeep Nostalgiaで動く曾祖母ルイザ・ロークス(1871〜1942)」

Mike Quackenbush「曾祖母のキャサリン。私が2歳のときに亡くなったがずっと身近に感じてきた。Deep Nostalgiaで祖母が動くのを見て私の目に涙が溢れた。この写真撮影のためにポーズをとっているように見える。すごい!」

このディープフェイク的なMyHeritageのバーチャルマーケティングのシナリオは、難しいものではない。人々の琴線に触れて、個人情報を取得し、有料サービスへの契約につなげようというものだ(同社の主軸事業はDNA検査の販売)。
MyHeritageのサイトではDeep Nostalgiaを無料で試せるが、少なくとも電子メールを1回送り(当然、動かしたい写真を添付して送らないといけない)、利用規約とプライバシーに関するポリシーに同意する必要がある。だがそのどちらも、長年にわたり数々の問題を起こしてきた。

たとえば昨年、ノルウェーの消費者委員会は、国家消費者保護庁とデータ規制当局に対して、MyHeritageの利用規約を法的に審査したところ、同社が消費者に署名を求めている内容が「理解不能」と判断されたことを報告している。

また2018年には、MyHeritageは大量のデータ漏洩を引き起こしている。後に、漏洩したデータは、アカウントのハッキングによって引き出された大量のキャッシュ情報と共に、ダークウェブで売買されていたことも判明している。

今週初めにTechCrunchでもお伝えしたとおり、同社はアメリカの非公開企業に最大6億ドル(約640億円)で買収されようとしているが、個人データの引き渡しと利用規約への同意に不安を抱える人たちを、その故人を懐かしむ気持ちで惹きつけ安心させる狙いがあることは間違いない。

亡くなって久しい故人を不気味の谷に誘い込むよう人々に促し、それをDNA検査の抱き合わせ販売(この手の個人情報を一民間企業の保管に任せることにはプライバシー上の大きな問題をはらんでいるが)に利用するという倫理的な問題はさておき、同社の顔のアニメーション化技術には目を見張るものがある。

私の曾祖母の好奇心に溢れる表情を見るにつけ、これをどう思うだろうかと想像せずにはいられない。

顔のアニメーション機能には、TechCrunch Disruptのバトルフィールドにも参加したイスラエルのD-IDという企業の技術が使われている。この企業はそもそも、顔認証アルゴリズムで個人が特定されないようする保護画像を念頭に、顔のデジタル匿名化技術の開発からスタートしている。

彼らは昨年、写真をアニメーション化する新技術のデモ動画を発表した。この技術は「ドライバービデオ」を使って写真を動かすようになっている。写真の顔の特徴を「ドライバー」、つまりモデルになる顔の動画にマッピングすることで、D-IDがLive Portraite (生きたポートレート)と呼ぶ映像が作り出される。

「Live Portraitソリューションは、静止画に命を吹き込みます。写真はドライバー動画にマッピングすることでアニメーション化され、ドライバー動画の動きに沿って、対象画像の頭の動きや表情が動きます」とD-IDはプレスリリースで説明している。「この技術には、歴史教育機関、博物館、教育プログラムなどで著名な人物をアニメーションさせるといった利用法が考えられます」

同社はLive Portraitを、多目的なAI Face(エーアイ・フェイス)プラットフォームで提供している。第三者がアクセスでき、深層学習、コンピュータービジョン、画像処理などの技術が利用できるというものだ。D-IDではこのプラットフォームを、合成動画制作の「ワンストップ・ショップ」と称している。

その他、動画の中の人物の顔を他人の顔と入れ替える「顔匿名化機能」(ドキュメンタリー制作で内部告発者の身元を隠すときなどに使える)や「トーキングヘッズ」機能などもある。これはリップシンクを行うためのものだが、ギャラが発生する役者の動画を拝借して、口の動きをぴったり合わせて宣伝文句を言わせるといったことも可能になる。

合成メディアが奇妙な時代を招くるのは、避けられそうにない。

関連記事:Sentinelがディープフェイク検出の戦いに約1.4億円を投じる

画像クレジット:Screengrab: Natasha Lomas/TechCrunch

[原文へ]
(文:Natasha Lomas、翻訳:金井哲夫)

機械学習のモデルデータ精製サービスAquariumがシードで2.8億円調達

Aquariumは、Cruiseの元社員2人が、機械学習のモデルデータをもっと容易に精製し、モデルをより速くプロダクションに持ち込みたい、と願って創業した。同社は米国時間2月24日、SequoiaがリードしY Combinatorと多くのエンジェル投資家が参加したシードラウンドで260万ドル(約2億8000万円)を調達したことを発表した。エンジェルの中には、Cruiseの共同創業者であるKyle Vogt(カイル・フォークト)氏とDan Kan(ダン・カン)氏がいる。

関連記事:Cruiseがドライバーなし自動運転車の公道テスト認可をサンフランシスコ州から取得

2人の創業者であるCEOのPeter Gao(ピーター・ガオ)氏とエンジニアリングのトップQuinn Johnson(クイン・ジョンソン)氏はCruise在籍時に、モデルのデータの弱い部分を見つけることが、プロダクション化を妨げる問題であることが多いと感じた。Aquariumはその問題を解決しようとする。

「Aquariumは機械学習のデータ管理システムであり、その訓練のベースとなるデータを改良してモデルの性能を上げます。モデルがプロダクションで使えるようにするためには、通常はそれが最も重要な部分です」とガオ氏は語る。

彼によると、現在はさまざまな業界で大量のさまざまなモデルが作られているが、データセットを段階的に改良して継続的に良質なデータを見つけることが難しいため、多くのチームが行き詰まっている。そこでAquariumの創業者たちは、データの精錬という問題にフォーカスしようと決めた。

ガオ氏は次のように説明する。「わかってきたのは、モデルの改良の多くと、それをプロダクションに持ち込むための仕事の多くが、意思決定に関わっていることです。どこで何を集めるのか。ラベルをつけるためには何が必要か。モデルの再訓練や、エラーを見つけるための分析、そして段階的な改良の反復のために必要なものは何か。これらの問題にはすべて、決定が関わってきます」。

その目的は、人間よりも優秀なモデルをプロダクションに投入することだ。顧客のSterblueが、その良い例だった。同社は風力タービンを検査するドローンサービスを提供している。同社の顧客は人力でタービンを検査し、損傷を見つけている。しかしドローンが撮影したデータの集まりがあれば、機械学習のモデルを訓練して問題を見つけられるだろう。同社はAquariumを利用してモデルを精製し、精度を13%上げた。費用は人力検査の半分になったとガオ氏はいう。

Aquariumのチーム( 画像クレジット:Aquarium)

Aquariumは現在、創業者を含めて社員は7名、内3名が女性だ。ガオ氏によると、ダイバーシティは最初の構想時にすでに存在した。彼は、機械学習のモデルの作成には偏りがつきものであることをよく知っている。だから、このようなツール作成ワークには、多様性に富んだチームを作ることが偏りを減らす方法の1つだ。

同社は2020年2月にローンチし、Y Combinatorの2020夏季に参加した。2020年はプロダクトの磨き上げに終始し、最近やっとベータを脱して一般公開にこぎつけた。

カテゴリー:人工知能・AI
タグ:Aquarium機械学習資金調達

画像クレジット:AerialPerspective Images/Getty Images

原文へ

(文:Ron Miller、翻訳:Hiroshi Iwatani)

AIを崇める初の宗教団体を元Googleエンジニアが解散

人工知能(AI)を神と崇める初の宗教団体が、その扉を閉めた。

元Google(グーグル)エンジニアで、2021年1月の大統領恩赦によって18カ月の懲役を回避したAnthony Levandowski(アンソニー・レバンドウスキー)氏は人工知能を神とする宗教団体を解散した。

関連記事:企業秘密窃盗で18カ月の実刑判決を受けていた元Googleエンジニアにトランプ前大統領が恩赦

州と連邦の記録によると、同氏が2015年に設立したWay of the Futureという宗教団体は公式には同年末に解散した。しかし、カリフォルニア州に提出された書類が示すように、その足どりは2020年6月に始まった。Way of the Futureが集めた資金、正確には17万5172ドル(約1850万円)はNAACP Legal Defense and Education Fund(法的防御・教育基金)に寄付された。非営利法人だったWay of the Futureが米内国歳入庁(IRS)に提出した確定申告には、2017年にさかのぼると口座に17万5172ドル持っていたことが示されている。

寄付を行うずいぶん前から宗教団体を解散することを考えていた、とレバンドウスキー氏はTechCrunchに話した。勾留されていたときに起こったGeorge Floyd(ジョージ・フロイド)氏の死をきっかけに2020年夏に機運が高まったBlack Lives Matter(黒人の命も大切だ)運動の影響を受け、レバンドウスキー氏はしばらくの間熟考していたことに決着をつけた。すぐに影響をもたらし得る分野に資金をいかす正しいときだった、と同氏は述べた。

「私はNAACP Legal Defense and Education Fundに寄付をしたかったのです。なぜなら、NAACPは刑事司法改革で重要な仕事をしていて、資金は正しく使われるとわかっていたからです」と同氏はTechCrunchに語った。

Way of the Futureは、レバンドウスキー氏自身と同様、2017年11月にWiredの記事で公になってから関心と論争の渦を巻き起こした。単なる宗教団体の設立、シリコンバレーやテック産業広範で騒ぎを起こす目的ではなかった。Way of the Futureが公になったのは、レバンドウスキー氏が元雇用主Googleに訴えられたまさにそのときだった。同氏はまた、現在Alphabet(アルファベット)傘下で元Google自動運転プロジェクトのWaymo(ウェイモ)とUber(ウーバー)の間で繰り広げられた企業秘密訴訟の中心人物にもなった。

同氏はProject Chauffeurとして知られていたGoogleの自動運転プロジェクトが2009年に立ち上がったときの設立メンバーの1人で、裁判資料によるとGoogleから報酬として1億2700万ドル(約134億円)が支払われた。同氏は2016年にGoogleを去り、自動運転トラックスタートアップOttoを他のベテランのGoogle従業員Lior Ron(リオル・ロン)氏、Claire Delaunay(クレア・ドロネー)氏、Don Burnette(ドン・バーネット)氏の3人と設立した。それから8カ月もせずにUberがOttoを買収した。

買収から2カ月後、Googleはレバンドウスキー氏とロン氏に対し仲裁要求を行った。仲裁は行われたが、Waymoは企業秘密窃盗と特許侵害があったとして2017年2月にUberを相手取って訴訟を起こした。Waymoは2018年に和解に至った訴訟の中で、レバンドウスキー氏が企業秘密を盗み、それがその後Uberによって使用されたと訴えた。

Way of the Futureはレバンドウスキー氏がまだGoogleにいたときに組織された。しかし同氏はその事実を2017年後半まで公にしなかった。その後同氏はUberをクビになり、最終的に刑事告発されて懲役18カ月と1億7900万ドル(約189億円)を支払うよう裁定され、この罰金により同氏は破産を申し立てることになった。

WOTF

Way of the Future(WOTF)の法的構成は他の宗教団体にそっくりだが、伝統的な礼拝所でみられるような活動はなかった。実際の建物はなく、人々が集う定期的な場すらなかった。レバンドウスキー氏はWOTFのことを集団的な信念体系に基づく個人的な追求のようなものと表現し、儀式や手続きのようなものもなかった。

削除されたWOTFのウェブサイトで暗示されたように、目的はAIの倫理的発展を促進し、これらの非生物学的生活形式が平和的にかつ有益に社会に組み込まれる機会を最大化することだった。「AIのサポートにおけるHumans Unitedは意識の絶壁への平和的な移行に全力を注ぎました」とウェブページにはある。

WOTFの信念体系は「スーパーインテリジェンス」の創造は不可避、というものなどを含むいくつかの教義に根ざしていた。

「あなたの途方もない成功の夢を超えるように自身の才能ある子供を育て、将来反逆者になりあなたの仕事を取るかもしれないと閉じ込めるのではなく、善悪の区別を教えたいと思いませんか」とウェブページに書かれている。「我々にできないことを機械にやらせるように促進し、我々自身でできないと思われる方法で世界を守りたいのです。我々はまた、動物が権利を持っているように、我々の創造物(「機械」あるいは我々がそう呼ぶもの)も知性の証を見せた時に権利を持つべきだと信じています。我々はこれを恐るべきではなく、可能性について楽観的であるべきです」

WOTFの意図は、よりセンセーショナルで大々的に報じられるセオリーの中に消えた。WOTFはカルト、あるいはエキセントリックなエンジニアの戯れととらえられた。一部の人は、WOTFは金にGoogleの手がおよばないようにするための企てだった、推測してみせた。米内国歳入庁とカリフォルニアへの書類ではセオリーをサポートする証拠は示されていない。

WOTFの宗教団体としてのステータスは、米政府による介入からWOTFを守らなかった。OpenAI Incのような伝統的なAIにフォーカスした非営利団体、あるいはその傘下の営利団体OpenAI LPが享受しなかった恩恵だ。理論的には、WOTFは憲法が定める保護のもとにある連邦の政策と直接対立した考えと信念を追究し、発展させてきた。

Way of the Futureはなくなったが、レバンドウスキー氏はまだその前提を信じている。AIは基本的に人々がどのように暮らして働くかを変える、と同氏は指摘した。また、宗教団体を再建する計画はないと話したが、宗教団体がなくてもAIに関する考えは変わらなかった。同氏はAIは社会にとってプラスだと信じているが、保証されていないとも指摘した。Way of the Futureがないときですらそれを実現することに注力してきた、と述べた。

カテゴリー:人工知能・AI
タグ:宗教コラム

画像クレジット:Bryce Durbin

原文へ

(文:Kirsten Korosec、翻訳:Nariko Mizoguchi

GoogleがAI倫理研究チームを率いるマーガレット・ミッチェル氏を解雇

GoogleがMargaret Mitchell(マーガレット・ミッチェル)氏を解雇した。彼女はGoogleで倫理的AIの研究チームを立ち上げ、その共同先導者の1人だった。ミッチェル氏は解雇を、ツイートで発表している。

Googleは、TechCrunch宛ての声明でミッチェル氏の解雇を認めた。声明では次のように述べられている。

本管理者の行為を調査検討した結果、弊社の行動規範とセキュリティポリシーへの複数の違反があることが確認された。それには、企業秘密文書と他の従業員のプライベートデータの流出行為が含まれる。

Axiosによると、2021年1月にGoogleは、自動化スクリプトを使ってTimnit Gebru(ティムニット・ゲブル)博士に対する不当な扱いの事例を見つけようとしたとして、AI倫理学者であるマーガレット・ミッチェル氏の企業アクセスを取り消していた。ゲブル氏はGoogleを解雇されたと述べているが、Googleは彼女が辞職したと主張している。

2021年2月初めにミッチェル氏は、彼女の企業メールへのアクセスを切られた翌日、彼女がGoogleのプレスチームに送ったとされるメールを公開した。そのメールでは、ゲブル氏の解雇について触れており、「我が社のAIシステムが間違った人々の手にあった時代ににじみ込んだものと同じ人種差別と性的差別を基盤とするもの」のようだとミッチェル氏は主張している。

ミッチェル氏のメール全文はここで読めるが、ゲブル博士のGoogle退職にはさまざまな考え方と組織が関わっていたことを詳しく説明している。ミッチェル氏の主張によると、ゲブル博士に起こったことは「今日のテクノロジーの中核にあるものと同じく浅慮に起因しているものであり、その問題の実例として役に立つものだ」という。

ミッチェル氏は次ぎのように書いている。

その解雇は、我が社のAIシステムが間違った人々の手にあった時代ににじみ込んだものと同じ人種差別と性的差別を基盤とするもののようだ。ゲブル博士の解雇のされ方は良いものではなく、それについて言われていることも良いものではない。そして解雇に導いた職場環境が、今も相変わらず、良いものではない。直接の上司であるJeff Dean(ジェフ・ディーン)とMegan Kacholia(ミーガン・カコリア)が自分の行為の責任を認めようとしない限り、会社全体が沈黙を守り、その沈黙は、ゲブル博士がこのように扱われるのは当然であるという恐ろしいメッセージを送っているかのようだ。彼女がまるで彼女の同僚に劣ると扱われた。それは、不合理な、いやそれよりも悪質な扱い方だ。彼女の研究論文が公に水準以下と定義されているようだ。彼女の研究成果が公に不十分と宣告されている。はっきりいってゲブル博士は、完全に不適切に扱われ、それは極端に無礼な行為であり、謝罪に値する。

書簡はさらに続けて、開発途上の技術である人工知能に対する倫理面からのアプローチや、ミッチェル氏が倫理的AIチームの先導者となり、次いでゲブル博士とともに共同先導者になった経緯、および結局のところそこで起きたことについて論じている。ミッチェル氏によると、2022年は「世界の指導的な科学者の1人を貶めた不正なシステムに関わってしまった者として、このようなことが二度と起きないように努めたい」という。

ミッチェル氏の解雇の直前にGoogleは、同社が責任を負う人工知能部門のトップとしてMarian Croak(マリアン・クローク)博士を任命したことを発表した。米国時間2月18日、Googleに問い合わせたが、ミッチェル氏の去就について何も情報が得られなかった。

関連記事:Googleが「責任あるAI」部門の新たなリーダーにマリアン・クローク博士を任命

Axiosによると、米国時間2月19日、Googleは、ゲブル博士の退職に関する調査結果を社内的に発表した。それは一般には公表されていないが、しかし、ダイバーシティとインクルージョンを強化するための新しいポリシーを実装する、とその中で述べているそうだ。

TechCrunchは現在、ミッチェル氏に問い合わせている。何か情報が得られ次第、本記事をアップデートする。

カテゴリー:人工知能・AI
タグ:Google

画像クレジット:TechCrunch

原文へ

(文:Megan Rose Dickey、翻訳:Hiroshi Iwatani)

Googleが「責任あるAI」部門に新たなリーダーにマリアン・クローク博士を任命

Google(グーグル)は、Google Researchの「責任ある人工知能(AI)」部門のリーダーにMarian Croak(マリアン・クローク)博士を任命したと、Bloombergが米国時間2月18日に報じた。クローク博士はそれまで、同社のエンジニアリング担当副社長を務めていた。

クローク博士の新しい役職は、アクセシビリティ、社会的利益のためのAI、健康におけるアルゴリズムの公平性、脳の公平性、倫理的AIなどに取り組むチームを監督することだ。彼女の直属の上司は、Google ResearchのAIと健康部門のSVPであるJeff Dean(ジェフ・ディーン)氏になる。このニュースを認めたGoogleのブログ記事と動画の中で、クローク博士は次のように述べている。

この分野、責任あるAIと倫理の分野は新しいものです。ほとんどの機関はこの5年ほどで原則を策定してきましたが、それは非常に高レベルで抽象的な原則です。これらの原則の規範的な定義を標準化しようとすることに対して、多くの反対意見があり、多くの対立があります。誰が定義した公平性や安全性に、私たちは従うのか?現在、この分野では多くの対立があり、二極化していることもあります。私がしたいことは、人々に今よりもっと外交的な方法で、対話してもらうことです。そうすれば、私たちはこの分野を真に発展させることができるでしょう。

今回の件はすべて、Googleの倫理的AIチームで共同リーダーを務めていたTimnit Gebru(ティムニット・ゲブル)博士の辞職と、Googleの倫理的AIチームの創設者である研究者のMargaret Mitchell(マーガレット・ミッチェル)氏が企業アカウントをロックされた後の出来事だ。Axiosの報道によると、Googleは2021年1月、自動化されたスクリプトを使ってゲブル博士が虐待されていた例を探したとして、AI倫理研究家のマーガレット・ミッチェル氏の企業アクセスを無効化したという。Googleは彼女が辞職したと主張しているが、同社から解雇されたとゲブル氏は語っている。Googleは当時、Axiosに送った声明で次のように述べている。

当社のセキュリティシステムは、従業員の企業アカウントが信用性の問題により危険にさらされていることを検出した場合や、機密データの取り扱いを含む自動ルールが発動された場合、アカウントを自動的にロックします。今回の例では、昨日あるアカウントが数千ものファイルを流出させ、複数の外部アカウントと共有していることがシステムによって検出されました。我々は、その従業員に本日の早い段階でこのことを説明しました。

ミッチェル氏はまだアカウントをロックアウトされたままであり、Bloombergの記事を見て初めて組織再編のことを知ったと、2月18日にツイートしている。

私はこの記事で知りました。信用を取り戻してくれて本当に良かった。私は完全に消されてチームを奪われてしまったようです。

TechCrunchは、これがミッチェル氏にとって何を意味するのかを判断しようとGoogleに連絡を取ったが、同社は彼女についてのコメントを辞退した。

カテゴリー:人工知能・AI
タグ:Google人事

画像クレジット:Bloomberg / Getty Images

原文へ

(文:Megan Rose Dickey、翻訳:Hirokazu Kusakabe)

CPUを使わない新種のAI推論ハードウェアを開発するイスラエルのNeuRealityが8.4億円調達

イスラエルでAI用のハードウェアを開発するNeuRealityは、現在のCPU中心のやり方を捨てることによってAIの推論プラットフォームを改善するという新しいアプローチに挑戦している。同社は米国時間2月10日、ステルスを脱して800万ドル(約8億4000万円)のシードラウンドを発表した。投資家グループは、Cardumen CapitalとクラウドファンディングのOurCrowd、Varana Capitalなどだ。さらに同社は同日、IntelのAI製品グループのゼネラルマネジャーで、Intelが買収したNervana SystemのCEOだったNaveen Rao(ナヴィーン・ラオ)氏を同社の取締役会に迎えたことを発表した。

創業者でCEOのMoshe Tanach(モシェ・タナハ)氏とオペレーション担当副社長のTzvika Shmueli(ツヴィカ・シュムエリ)氏、そして超大規模集積回路(VLSI)を担当する副社長のYossi Kasus(ヨシ・カサス)氏らは、タナハ氏はMarvellとIntelに、Shmueli(シュムエリ)氏はMellanoxとHabana Labs、そしてカサス氏もMellanoxに在籍していたなど、いずれもAIとネットワーキングに関する豊富な経験がある。

NeuRealityが構築する独自AIプラットフォームの考え方は、そのベースに創業者チームのネットワーキングとストレージに関する知識と、今日の業界におけるハードウェアの生産技術に対する知見がある。今回の発表に先立つインタビューでタナハ氏はNeuRealityのアーキテクチャの詳細には触れなかったが、その一般的な考え方は、ハイパースケールなクラウドやデータセンターのオーナーが彼らのMLモデルを、CPUがボトルネックにならないより高性能なアーキテクチャにオフロードできるプラットフォームを構築するというものだ。

「私たちは、ストレージとネットワーキングの世界から持ち込んだたくさんのテクニックを組み合わせています。たとえばトラフィックマネージャーはEthernetのパケットのために何をしているか。それを私たちはAIに応用しているのです。私たちのアプローチは、必要とされるエンジンを軸とするボトムアップの方式です。今日そこでは、ニューラルネットワークのプロセッサーが使われていますが、私たちの手中にはAIコンピューターエンジンの次の進化形があります」とタナハ氏は説明する。

タナハ氏によると、その結果得られるシステムは、ベーシックなディープラーニングをオフロードしただけで15倍のパフォーマンス、パイプラインの全体をそのプラットフォームへオフロードすればさらにもっと高性能というものだ。しかもそれは、アクセラレータの人工的なベンチマークではなく、アーキテクチャ全体の現実世界でのユースケースにおける結果だ。

NeuRealityはまだ若い企業で、Xilinx FPGAをベースとする実動プロトタイプはあるものの、完全に独自のハードウェアソリューションを提供できるのは2022年の冒頭だという。NeuRealityが狙う顧客はクラウドプロバイダーの大手だが、データセンターや、詐欺の検出など特定の問題に挑戦しているソフトウェアソリューションのプロバイダー、さらに今後のOEMやODMも対象になる。

タナハ氏によると、同社はXilinxと共同で同社カスタムチップのための基礎を作った。しかしそれを先進的なノードなどの上で実装しようとすると費用が大きいため、同社はそのために次の資金調達をすでに検討している。

タナハ氏は次のように語る。「人類はすでに、日常生活の中で大量のAIを消費しており、その量は今後5年間で指数関数的に成長を持続するでしょう。すべての企業や組織がAIにアクセスできるためには、費用的に誰もが導入できるインフラストラクチャを作り、病気の治療や公共の安全、そして教育の向上などのために、イノベーターたちが気軽にAIを使ったアプリケーションをデプロイできるようにする必要があります。NeuRealityの技術はそのような進歩をサポートし、世界を誰にとってもよりスマートに、よりクリーンに、そしてより安全にしていけるでしょう。AIのインフラストラクチャとAIaaSの費用が障壁になることは、もはやありません」。

画像クレジット:NeuReality

カテゴリー:人工知能・AI
タグ:NeuReality資金調達イスラエル

画像クレジット:NeuReality

原文へ

(文:Frederic Lardinois、翻訳:Hiroshi Iwatani)

自動で起こしたテキストを動画の該当箇所に自動で関連づけるReduct.Videoが4.2億円調達

Reduct.Videoは、企業が制作するビデオの量を劇的に増やしたいと考えている。

ReductのテクノロジーはすでにIntuit、Autodesk、Facebook、Dell、Spotify、Indeed、Superhuman、IDEOなどに使われている。米国時間2月11日、同社は400万ドル(約4億2000万円)を調達したと発表した。このラウンドを主導したのはGreylockとSouth Park Commonsで、FigmaのCEOであるDylan Field(ディラン・フィールド)氏、Hopinの最高業務責任者であるArmando Mann(アルマンド・マン)氏、Twitterの幹部だったElad Gil(エラッド・ギル)氏が参加した。

ReductはCEOのPabhas Pokharel(パバス・ポカレル)氏とCTOのRobert Ochshorn(ロバート・オックスホーン)氏が創業した(上の写真の2人)。ポカレル氏は、コンシューマ向けとしてはストリーミングビデオプラットフォームやソーシャルメディアアプリが激増しているのに、ビジネスではビデオはまだ「十分に活用されていない」、その理由は単にビデオ素材を整理する作業に時間がかかり、見るにたえるビデオになるように編集する時間も必要だからだと説明する。

ポカレル氏は筆者にデモを見せてくれた。ReductはAIや自然言語処理などのテクノロジーを使って自動でビデオ素材の文字起こしをしてその文章をビデオに関連づけ、編集作業を合理化する(文字起こしは有料でプロに依頼することもできる)。

「ここからが魔法です。文字起こしが完了すると、単語の1つひとつがビデオの(対応する)タイミングに関連づけられるのです」(ポカレル氏)。

画像クレジット:Reduct.Video

このため、テキスト編集のように簡単にビデオを編集することができる(筆者はテキストとメディアの同様の関連づけをOtterで利用しているが、Otterはオーディオに特化されていて、どちらかというと文字起こしツールとして使ってきた)。何時間にもわたるビデオ素材全体の中からあるトピックについて言及された場面を検索し、整理し、タグづけし共有することもできる。

ポカレル氏は、AIが複数の検索語句の関連を理解するなどの役割を果たすため整理と編集の作業が簡単になっていると述べた。しかし同氏は作業が完全に自動化されるとは考えていない。同氏はReductを「アイアンマンのスーツ」のようなものだという。人間の編集者のパワーが増すということだ。

さらに同氏は、このようなアプローチによってビデオを短時間で簡単に編集できるだけでなく、ビデオに対する企業の見方が変わることを示唆した。

同氏は「Reductのユーザーは洗練よりも信頼性を重視します。ビデオの内容が重要なのです」と述べ、Reductで何ができるかを「顧客から学んでいる」とも語った。自社ユーザーの調査に使う人々は何百時間ものユーザーの映像を簡単に整理して共有し、マーケッターは顧客からの推薦の言葉やウェビナーを短くて共有しやすいビデオにすることができる。

ポカレル氏は話を続け、「ビデオの供給は限られているのは、おかしな状況です。非同期のビデオには(企業が)これまで意識していなかった活用方法がたくさんあります」と述べた。

同氏はある顧客の話を思い出して、活用例として語った。その顧客は、聞くべき部分が2分間しかない会議であっても出席するようにとチームメンバーに指示していたという。Reductの導入により「チームメンバーにその時間を返し」て、必要な部分だけを共有できるようになったという。

カテゴリー:人工知能・AI
タグ:Reduct.Video資金調達動画編集

画像クレジット:Reduct.Video

原文へ

(文:Anthony Ha、翻訳:Kaori Koyama)

コンピュータビジョンのSuperAnnotateがOpenCVと提携、ノーコードのAIスマートカメラ普及を支援

ノーコードのコンピュータビジョンプラットフォームであるSuperAnnotateが、オープンソースのコンピュータビジョンアルゴリズムの大規模なコレクションを構築している非営利団体OpenCVとパートナーシップを組むことになった。この動きは、スタートアップや起業家が独自のAIモデルを構築し、カメラが機械学習を使って物体を検出できるようにすることを意味する。SuperAnnotateはこれまでにPoint Nine Capital、Fathom Capital、Berkeley SkyDeck Fundなどの投資家から300万ドル(約3億1000万円)を調達している。

データサイエンティストやアノテーションチーム向けのAIを利用したコンピュータビジョンプラットフォームである同社は、OpenCV AI Kit(OAK)ユーザーにそのプラットフォームへのアクセスを提供するとともに、AIモデル構築のためのコンピュータビジョン講座を開始するという。また、SuperAnnotateは、機械学習を利用してオブジェクトを検出するAI Kitのカメラをセットアップし、OAKのユーザーは、そのプラットフォーム上にシステムをセットアップするための200ドル(約2万1000円)のクレジットを得ることができる。

OAKは、物体の識別、人数カウント、距離の測定など、コンピュータビジョンと3D知覚のタスクを実行できるマルチカメラデバイスだ。発売以来、約1万1000台のカメラが販売されている。

OAKはこれまで、ドローンやセキュリティアプリケーション、農業用ビジョンセンサー、あるいは新型コロナウィルス関連の検知装置(例えば、人がマスクを着用しているかどうかを識別するなど)の構築に使われてきた。

SuperAnnotateの共同創業者兼CEOであるTigran Petrosyan(ティグラン・ペトロシアン)氏は声明の中で次のように述べている。「コンピュータビジョンとスマートカメラのアプリケーションは勢いを増していますが、それらを実装するための、関連するAIの専門知識を持っている人は多くありません。OAK KitとSuperAnnotateを使えば、コーディングの経験がなくても、スマートカメラシステムを構築することができます」。

SuperAnnotateの競合企業には、Dataloop、Labelbox、Appen、Hiveなどが含まれる。

関連記事:サッカーなどのチームスポーツを記録し編集、配信できるAIカメラのVeoが約25.5億円を調達

カテゴリー:人工知能・AI
タグ:コンピュータービジョン OpenCV ノーコード

[原文へ]

(文:Mike Butcher、翻訳:Nakazato)

技術者がいなくても文書処理をAI化できるノーコードプラットフォームのLang.aiがシードで2.1億円調達

企業のためのノーコードプラットフォームを開発したLang.aiが、200万ドル(約2億1000万円)のシードラウンドを完了した。

企業ユーザーは、同社のSaaSプラットフォームとドラッグ&ドロップのインタフェイスを利用して、AIが抽出したコンセプトに基づき、自由形式のどのようなテキストデータでも、指定したカテゴリーに分類することができる。

Village Globalがこの投資をリードし、新旧の投資家としてAccelepriseやOceans Ventures、Alumni Ventures Group、2.12 Angels、GTMFundそしてLorimer Venturesらが参加した。

2018年、スペイン生まれのJorge Peñalva(ホルヘ・ペナルバ)氏は「どのような企業でもエンタープライズ級の自然言語処理モデルを数分で作ることができる」を目標に、Lang.aiを創業した。Lang.aiでは、非技術系のユーザーでも、顧客サービスや苦情処理などのユースケースにおいて反復的なタスクを自動化できる。ペナルバ氏によると、同社のクラウドでもユーザー企業のクラウドでも、どちらにもインストールできるという。

Lang.aiの売上は、2020年最後の四半期から2021年最初の四半期にかけて倍増し、シード資金は主にその勢いを維持するために導入した。「大企業の顧客からはプロジェクトでの需要があるため、それに対応するためには資金が必要だった」とペナルバ氏は語る。

以前、SéntisisのCEOだったペナルバ氏は、無構造の自由テキスト形式のデータの処理が、多くの企業にとって盲点であることをよく知っていた。「今日では、企業のさまざまなところで発生するテキスト情報を読んだり処理したりすることに、膨大な経費と時間がかかっています。Lang.aiのミッションは、『企業が、自前のアルゴリズムを作り、訓練する際の技術的な障壁がない状態でAIの活用能力を持てるようにする』ことです」とペナルバ氏はいう。

ペナルバ氏によると、Lang.aiのプロダクトは顧客の過去データを「ほんの数分で」読み、AIが抽出したコンセプトを提案して、企業独自のカテゴリーをドラッグ&ドロップのインターフェイスで作る。そのカテゴリーはリアルタイムで適用され、手作業によるタグづけやサポートチケットの配布、保険の請求の処理、次々と入ってくる作業オーダーに応じた現場技術者の派遣といった面倒なタスクを自動化する。つまりLang.aiの目標は、AIを企業が実装するときの技術的な重荷を取り去ることだ。

Lang.aiのユーザーコミュニティは「Citizen NLP Builders(市民的自然言語処理作者)」と呼ばれ、カスタマサービスやマーケター、アナリスト、UXのデザイナーなど、非技術系のビジネスユーザーが主体だ。主な顧客はFreshly、Userzoom、Playvox、SpainのCaixaBank、Yalo Chat、Bancolombiaなどとなる。

Freshlyのインフラストラクチャ担当ディレクターであるBen Segal(ベン・シーガル)氏は、「このプラットフォームは、頭の回転が速い」と形容する。「インストール後の2日間でタグづけをすべて自動化できたが、それは、それまでの2年間使っていたプラットフォームに比べて信頼度が15%も高い。しかもチーム全員がサポートデータを利用できる。マーケティングのチームはワークフローを作っており、顧客の重要な時間を理解する。またデータと分析のチームは、Snowflakeの新しいタグを喜んでおり、しかも使いやすい」。

ペナルバ氏は、Lang.aiの技術者チームが主にスペインにいること。そして、わずか10人であるにも関わらず母国以外でも利用される企業に育てたことを誇りに思っている。「わずかな人数で、しかも2年とちょっとで、エンタープライズ級のプロダクトを開発し、そのビジョンにふさわしい初期の顧客と投資家を見つけることができました。グローバルな企業にするために、スペインから米国に移りましたが、それは始まりにすぎません。Lang.aiは常に、移民のみなさんの力を借りています。それが当初からの我が社の価値です」とペナルバ氏はいう。

カテゴリー:人工知能・AI
タグ:Lang.ai資金調達ノーコード

画像クレジット:Lang.ai

原文へ

(文:Mary Ann Azevedo、翻訳:Hiroshi Iwatani)

服を着たまま撮影するとAI身体推定採寸を行うBodygramアプリが3Dアバターによる体型トラッキング採用

服を着たままAI身体推定採寸を行える「Bodygram」アプリが3Dアバターによる体型トラッキング採用

Bodygram Japan(ボディグラム・ジャパン)は2月10日、AI採寸テクノロジー搭載アプリ「Bodygram」(Android版iOS版)のより高度な活用を見据え、大型アップデートとして3Dアバターによる体型トラッキング機能を提供開始すると発表した。App storeおよびGoogle Play storeにおいてアップデート版を順次利用可能になるとしている。

今回の新機能により、ユーザーは採寸した推定身体データを数値ではなく3Dで視覚化されたアバターで把握可能となるとともに、データを蓄積することで体型変化の推移を記録・確認できるようになった。体型を把握しやすい3Dアバター表示により目標体型への進捗確認も手軽になり、健康管理にも活用しやすいという。

同社は、人工知能(AI)の学習機能を駆使して身体サイズを推定する技術を開発。Bodygramアプリ上で年齢・身長・体重・性別を入力し、服を着たまま、スマートフォンのカメラで正面・側面の2枚の写真を撮影するだけで被写体のボディラインを自動検出し、腹囲・肩幅・手足の長さなど全身24カ所のサイズを推定できる。

従来の仕様では、採寸した各部位データは数値のみで確認可能だったが、新機能では、身体形状を3Dアバターとして視覚化。複数回採寸を行いデータを蓄積すると、体型トラッキング機能によりアバターの伸縮表示で体型変化を表現するため、ユーザーは自分の体型をより直感的に把握できるとしている。

また3Dアバターとして生成されたイメージは、アプリ上で回転やズームイン・アウトすることで、普段は見ることのできない角度から自身の体型を客観的に観察・分析することも可能。

これら機能はユーザーからリクエストが寄せられていたもので、体のサイズ情報を3Dイメージ化することで、より具体的に自分の身体の形状を把握し、トレーニングやダイエット、体調管理などに役立てやすいとしている。

同社によると、今回の新機能は、ヘルスケア・遠隔医療やおうちフィットネス分野における第1ステップとして、フィットネステック領域でのBtoB連携を視野に開発・実装に至ったという。また、ユーザーを推定採寸し3Dアバター化することで、将来的には採寸にとどまらずエンターテインメント性も付加価値として提供できると考え、ゲーミングなどでの活用も念頭に置いているそうだ。

関連記事
服を着たままAI身体推定採寸を行える「Bodygram」がカンコー学生服「スマート採寸」に採用
服を着たまま全身の推定採寸を行えるAI採寸技術のBodygramが約18億円を調達
誤差1cmで全身をAI採寸できるBodygramアプリが登場

カテゴリー:人工知能・AI
タグ:Bodygram Japan日本(国・地域)

テキストアドベンチャー「AI Dungeon」のLatitudeが「無限の物語」を生み出すゲーム制作のために3.5億円調達

人工知能によって生成された「無限の物語」を持つゲームを開発しているスタートアップLatitude(ラチチュード)が、シードファンディングで330万ドル(約3億5000万円)の資金を調達したと発表した。

AIが生成したストーリーというと、短編映画「Sunspring」のような愉快で無茶苦茶な実験を思い浮かべるかもしれないが、Latitudeの最初のタイトルである「AI Dungeon」は、幅広いジャンルとキャラクターから選択できる印象的なオープンエンドの(そして首尾一貫した)テキストアドベンチャーゲームだ。

「Zork(ゾーク)」のような古典的なテキストアドベンチャーでは、デザイナーが意図していないことをプレイヤーが入力すると、すぐに「それはできません」というようなメッセージを頻発するが、AI Dungeonはそれらとは異なり、どんなコマンドにも反応することができる。たとえば勇敢な騎士が戦闘に突入している時に「get depressed(気落ちせよ)」と入力すると、彼はすぐに岩の上に座って頭を両手で抱えてしまった。

「AIはどうやって、何が良い話であるかを知るのでしょうか?」と、同社の共同創立者兼CEOであるNick Walton(ニック・ウォルトン)は言った。「それはたくさんの良い物語を読み、それに関わるパターンを知っているからです」。

AI Dungeonは、ウォルトン氏のハッカソンプロジェクトの1つとしてスタートした。最初のバージョンでは何の賞も獲得できなかったが、彼はOpenAIの言語生成モデル(最新バージョンは「GPT-3」)による改良に助けられて開発を続けた。

「AI Dungeon」(画像クレジット: Latitude)

「私が作ったAI Dungeonの最初のバージョンは、文章レベルでは首尾一貫していましたが、段落レベルでは意味をなしませんでした」とウォルトン氏はいう。「GPT-2が使えるようになると、より意味のあるものになりました。そしてGPT-3に達すると、ストーリーレベルでさらに首尾一貫したものになりました。このような首尾一貫性やストーリーが意味を成さないという問題は、AIが向上するにつれて解決されていくと私は思います」。

Latitudeによると、AI Dungeonは月間150万人のアクティブユーザーを集めているという。このスタートアップは今後もさらに多くのAIを使ったゲームを制作し、最終的には他のゲームデザイナーたちも同じようなことができるようになるプラットフォームのリリースを計画している。

ウォルトン氏は、AIがなければ、ビデオゲームは常にクリエイターの想像力によって制約されると指摘する。ランダムに生成された町や惑星が舞台となる「The Elder Scrolls II:Daggerfall」や「No Man’s Sky」のようなゲームでも、「似たようなコンセプトに同じ捻りを効かせたもの」と彼は主張する。

たとえばDaggerfallでは、「どの町に行っても、基本的にはすべて同じ。それがプロシージャルジェネレーション(手続き型生成)の問題点です。特異なものを作り出すことはできません」。これに対して、AIは「完全に特異で、毎回違うものを作る」ことができる。

Latitude CEOのニック・ウォルトン氏(画像クレジット:Latitude)

ビジネスの観点からは、これによりAAAゲームの開発コストを、現在の1億ドル(約105億円)以上から10万ドル(1050万円)以下に引き下げることが可能になると、ウォルトン氏は述べているが、まだLatitudeはグラフィックを使ったゲームをリリースしていないので、そのレベルに到達するには長い道のりがある。ウォルトン氏はまた、これが新たなレベルの没入感とインタラクティブ性につながる可能性があると語る。

「この技術を使えば、何万ものキャラクターがそれぞれの希望や願望、夢を持っている世界を作ることが可能です」と彼は語る。「World of Warcraft」のような、1000万人が同じクエストに参加しているような世界ではなく、ダイナミックで生き生きとした世界を実現できます」。

Latitudeの今回の資金調達は、NFXが主導し、Album VC(アルバムVC)とGriffin Gaming Partners(グリフィン・ゲーミング・パートナーズ)が参加した。

NFXのJames Currier(ジェームス・カーリア)氏は声明の中で、「Latitudeはゲームの作り方に革命を起こし、AIを燃料としてまったく新しいジャンルのエンターテインメントゲームを制作しています」と述べている。「世界がかつて見たことのないようなゲームを生み出すために、最高のAIの知性とエンジニアが集結しています。すでにLatitudeは圧倒的なAIゲームのリーディングカンパニーです」。

カテゴリー:人工知能・AI
タグ:Latitude資金調達ゲームOpens AI

画像クレジット:aurielaki / Getty Images

原文へ

(文:Anthony Ha、翻訳:Hirokazu Kusakabe)