NVIDIAが高性能AIを医療の現場にもたらす、AI搭載の医療機器開発プラットフォーム「Clara Holoscan MGX」を発表

高性能な画像処理装置(GPU)で知られるNVIDIA(エヌビディア)は今週、AI搭載の医療機器を開発するためのプラットフォームをデビューさせた。Clara Holoscan MGX(クララ・ホロスキャンMGX)と呼ばれるこのデバイスは、そのコンピューティングパワーにより、医療用センサーが複数のデータストリームを並行して処理し、AIアルゴリズムを訓練し、生物学をリアルタイムで視覚化することを可能にする。

NVIDIAの2022年GTCカンファレンスでデビューしたClara Holoscan MGXは、Jensen Huang(ジェン・スン・フアン)CEOが基調講演で述べたように「オープンでスケーラブルなロボティクスプラットフォーム」であり、ロボットの医療機器やセンサーをAIアプリケーションとつなぐために設計されたハードウェアとソフトウェアのスタックだ。

どう機能するのか。内視鏡検査のプロセスを例にとる。通常、医師は体の中に小さなカメラを挿入し、内部を観察する。Clara Holoscan MGXはカメラに直接接続され、収集したデータをリアルタイムに処理する。データはAIモデルに送られ、異常を検出し、解剖学的な分析を経て、外科医が治療計画に役立てる(断っておくが、これらのAIモデルはNVIDIAが作るのではなく、同社のハードウェア上で動くだけだ)。

NVIDIAはすでにGPUでよく知られており、そのGPUは特に並列計算を高速に実行することに優れている。GPUはかつてゲーマーに最もよく知られていたが、今やディープニューラルネットワークのトレーニングに関心を持つあらゆる業界にとって重要なアクセラレータになった。ディープニューラルネットワークは、例えばX線の読み取りを学習する際に、何十億ものデータポイントをすばやく計算する必要がある。そして、得られたモデルをリアルタイムで使用するためにも、多くの計算が求められる。このプラットフォームは、そうした用途を念頭に置いている。

NVIDIAはAI分野の支配的なプレイヤーとなった。上記のようなプロジェクトの多くに必要な生の計算能力を提供し、業界に特化したハードウェアとソフトウェアの組み合わせで、それを実現してきたからだ。例えば同社は、自動運転車の訓練と開発のためのプラットフォームであるNVIDIA Driveなどの自動運転車の分野のプロジェクトで積極的に動いている。

NVIDIAは、すでにヘルスケア領域への進出を果たした。2018年に初めて発表されたClaraプラットフォームは当初、スムーズな医療画像体験を実現するために設計された。このプラットフォームは年々拡張されてきたが、今回のClara Holoscan MGXプラットフォームは、基本的にはワンストップショップになることが目的だ。

NVIDIAのヘルスケア担当副社長Kimberly Powell(キンバリー・パウエル)氏はTechCrunchに対し、Clara Holoscanは「完全なエンド・ツー・エンドプラットフォームです。医療機器にとってのNVIDIA Clara Holoscanは、自動運転車にとってのNVIDIA Driveと同じ関係です」と語った。

Clara Holoscanの中核となる革新的な技術は2つあるとパウエル氏はいう。まず、医療用ソフトウェアを安全に開発するためのベンチマークプロセスであるIEC 62304規格に準拠した設計になっていること。そして、フアン氏が「非常識」と呼ぶほどのコンピューティングパワーを搭載していることだ。

この組み合わせにより、AIを搭載した医療機器の開発やトレーニングを検討している企業は、より迅速に前進することができるはずだ。

画像クレジット:NVIDIA

「Clara Holoscanのアーキテクチャは、新しい医療機器や『医療機器としてのソフトウェア』を市場に投入するために必要なエンジニアリング投資を大幅に削減します」とパウエル氏は話す。

NVIDIAが売り込んでいること、つまりデバイスとAIの組み合わせを実現しようとしている企業はすでに多数存在する。例えばスタートアップのActiv Surgicalは、AI支援型手術用スコープ(製品名:ActivSight)にNVIDIAのGPUを使用しており、スコープのデータから情報を得るAIアプリケーションをさらに充実させようとしている。そのために、同社はNVIDIAのInceptionプログラムに入り、Clara AGX Developer Kitに早期にアクセスできるようになった。プレスリリースを読む限り、そのキットは、NVIDIAの技術が製品開発を加速させるというパウエル氏の主張を象徴している。

「ActivSightを含め、将来、Activ Surgicalの製品を今後2年以内に市場に出すために、この開発者キットが全体の開発期間を短縮することにもなります」とActiv Surgicalのプレスリリースには書かれている。

現時点では、Clara Holoscanの全能力を利用することはできない。基調講演でフアン氏は、医療グレードの技術が早期利用できるようになるのは2023年第1四半期だと述べた。その時点で、ハードウェアの価格がNVIDIAのODMパートナーによって設定されて初めて、ソフトウェアの価格が「判明する」とパウエル氏は付け加えた(その情報はここに登場するようだ)。

今のところ、Clara Holoscan MGXの発売は、AIヘルスケア分野におけるNVIDIAのすでに確固たる足場をさらに強化するように思われる。基本的に、同社はそのプラットフォームの下にある計算の岩盤を構築しているのだ。

そして、それは良い分野だ。スタンフォード大学の「2022 AI Index」レポートによると、2021年のAIへの民間投資の2大領域は、上記2つの交わるところだった。データ管理・処理・クラウドコンピューティングに122億ドル(約1兆4830億円)、医療・ヘルスケアツールに112億9000万ドル(約1兆3720億円)が投資された。

画像クレジット:NVIDIA

原文へ

(文:Emma Betuel、翻訳:Nariko Mizoguchi

NVIDIA社員のパスワード数千件がネットに流出、ハッカー集団から奇妙な要求

半導体製造大手のNVIDIA(エヌビディア)から1テラバイト分のデータを奪ったと主張するランサムウェア集団は、一味のますます奇妙な要求に応じなければ、同社の「最も厳重に守られた秘密」をすぐにでも公開すると脅迫している。

NVIDIAからデータを盗んだことを、2月末に初めて表明したランサムウェア集団「Lapsus$」は、すでにデータの流出を始めている。データ漏洩監視サイト「Have I Been Pwned(ハブ・アイ・ビーン・ポウンド、HIBP)」によると、このハッカーたちは7万1000人以上のNVIDIA従業員の認証情報を盗んだとのこと。TechCrunchが確認したところでは、盗まれたNVIDIAのいくつかのメールアドレスは、すべて流出したようだ。HIBPによると、データにはメールアドレスとWindowsのパスワードハッシュが含まれており「その多くがクラックされ、ハッキングコミュニティ内に流通した」という。

NVIDIAは先日、攻撃を受けて従業員の認証情報が盗まれたことを認めたものの、影響を受けた人々に通知したかどうか、あるいは漏洩したアカウントのパスワードリセットを強制したかどうかについては、明言を避けた。この事件の影響が広がり、ハッカー集団の要求する期限が迫っているにもかかわらず、NVIDIAの事件対応ページは3月1日以降更新されていない

ハッカー集団は現在、NVIDIAがこのグループの奇妙な要求に応じない限り、回路図やソースコード、まだ発表されていない「RTX 3090 Ti」を含む最近のNVIDIAのグラフィックチップに関する情報など、同社の企業機密を公開すると脅している。

同グループはNVIDIAに対し、同社のRTX 30シリーズのグラフィックカード製品に搭載されている、物議を醸したEthereum(イーサリアム)採掘性能を制限する「Lite Hash Rate(LHR)」の削除を要求している。この性能制限は、暗号マイニングコミュニティの買い占めによって製品の在庫が枯渇し、ゲーマーが新しいグラフィックカードを入手できなくなったことを受けて、2021年5月に導入されたものだ。

「我々は、NVIDIAがすべての30シリーズのファームウェアに、すべてのLHR制限を削除するアップデートを配信することを望んでいる。さもなければ我々は(企業機密データが含まれる)フォルダをリークする」と、Lapsus$グループはTelegram(テレグラム)で述べている。「もし彼らがLHRを削除したら、我々はこのフォルダのことを忘れるだろう…。我々はどちらもLHRがマイニングとゲームに影響を与えることを知っている」。

先週初め、Lapsus$は別のおかしな要求を追加した。それは、NVIDIAに対して、macOS、Windows、Linux向けの、すべてのグラフィックチップのドライバをオープンソース化することを望むというものだ。同グループはNVIDIAに対し、3月4日までに応じるよう要求していた。

この日、TechCrunchはNVIDIAに、ハッカーの要求に応じる予定があるかと尋ねたが、同社はコメントを避けた。代わりに同社は、3月1日に発表したとものと同じ声明を我々に提示した。

画像クレジット:Getty Images

原文へ

(文:Carly Page、翻訳:Hirokazu Kusakabe)

M1 Pro / M1 Max搭載MacBook Proを使った暗号資産イーサリアムのマイニングは効率的!? ただし元を取るまで17年かかる

M1 Pro / M1 Max搭載MacBook Proを使った暗号資産イーサリアムのマイニングは効率的!? ただし元を取るまで17年かかる

UFD Tech

新型MacBook Proに採用されたM1 ProおよびM1 Maxは大幅な性能アップを実現していることから、暗号資産のマイニング(採掘)に使えないかと脳裏をよぎった人も少なくはないはず。それを実際に試してみた結果が報告されています。

海外掲示板Redditにも、同じ疑問を抱いた人たちがスレッドに集まっています。最初の「M1 Maxは55MH/sでETH(イーサリアム)を採掘できる?メモリの帯域幅はRX 6700 XTとRTX 3060 Tiの間だ」というお題をきっかけに「M1 Maxが40以上のMH/sを出せるなら、M1 ProではなくM1 Max MacBook Proを注文するよ」などの話題が盛り上がっています。

ちなみに「MH/s」とは暗号資産を採掘する速度であるハッシュレートの単位であり、1秒間の計算が100万回ということです。

さらに「考慮すべき事実は、最も効率的なSoCであり、専用GPUよりも電力消費がずっとずっと少ない。MacBookのリセールバリュー(買取や下取り価格)は基本的に市場で最も優れています(中略) SoCには、画面出力、超高速ビデオエンコーディング、暗号化、非常に強力なニューラルエンジンなど、特定の処理に特化した複数の専用プロセッサが搭載されています(中略)基本的には最も効率的な汎用CPUであると同時に、最も効率的なプログラマブルASICでもあるんだ」といったレスポンスもあり。

また「私は64GBのM1 Max 16(インチ)を持っていますが、ハイパワーモードで動作させたところ、ストックのethminer-m1バイナリで約10.25MH/が出ています。決して高速ではありませんが、非常に効率的で、1Wあたりのハッシュレートはおそらくとても良いでしょう」との声もあります。

そして実際にテストをして、数字を出している人もいます。YouTuberのUFD Tech氏はM1 Pro搭載Macで採掘をして、その電力効率の良さに驚いています。すでにM1 Mac向けに暗号採掘用のコンパイル済みバイナリソースコード)が配布されており、本動画ではそのインストール方法と使い方(今回はイーサリアム)が説明されています。

まず注意すべきは、バックグラウンドでのマイニングはしない方がいいということ。ちょっとしたWebブラウズでもマシンのパフォーマンスを落としてしまうので、Macを使わないときのみ実行したほうがよさそうです。

そうした注意を払った結果、M1 Proでは5MH/s以上の速度が出ており、総消費電力はわずか17W。Windows PCで同じ結果を出すためにははるかに多くの消費電力を必要とすることからも、十分にいい結果と言えそうです。

ただし電気代を差し引いた後の利益は、1か月あたりわずか12.82ドル、1日あたり約42セントにすぎません。もしも暗号資産マイニングのためだけにMacBook Proを買うとすれば、元を取るのに17年はかかる計算となります。購入から4~5年で下取りに出すとすれば利益はもう少し改善しそうですが、いずれにせよ小遣い稼ぎの域を出ることはなさそうです。

すでに購入している人は、Macを使っていないときにマイニングをしても害はなさそうではありますが、一攫千金は望むべくもないと思われます。4Kや8K動画編集などでM1 Max MacBook Proを24時間フル操業させている人は、今まで通り本来の業務に専念させておくのが賢明かもしれません。

(Source:RedditUFD Tech。Via 9to5MacEngadget日本版より転載)

東京大学齊藤研究室とバベルがAIエンジニアコミュニティ設立、wav2vec 2.0利用し日本語関連OSSプロジェクト開始

東京大学齊藤研究室とバベルがAIエンジニアコミュニティ設立、wav2vec 2.0利用し日本語関連OSSプロジェクト開始

AIオートメーション技術を軸にグローバルで事業展開を行うバベルは8月24日、東京大学大学院工学系研究科齊藤研究室(東京大学 齊藤研究室)と、誰でも参加可能なAIエンジニアコミュニティ「AI Automation Lab」(AIオートメーション・ラボ)を設立。日本語学習済みAIモデルのオープンソースソフトウェア(OSS)化を前提とする日本語音声書き起こし・会話の解析技術の共同研究を開始したと発表した。ベースとなるモデルとして、音声認識フレームワーク「wav2vec 2.0」を利用し、日本語に合わせて調整する。

wav2vec 2.0と呼ばれる書き起こしのモデルは、大規模なラベルなしデータを利用した事前学習を行うことで、少数のラベル付きデータセットでも高精度の書き起こしが可能という。日本語のような少数派の言語では、大規模なラベル付きデータを学習に利用することが困難な状況なものの、wav2vec 2.0はまさにそのような状況にある言語に適しているとした。

AI Automation Labには、connpass上の「AI Automation Lab(AI オートメーション・ラボ)」より参加できる。

昨今「音声書き起こし」に関する技術は全世界で著しく発展しており、英語や中国語を中心とした各国の言語に対して、wav2vec 2.0などの最新の学習済みAIモデルがOSSで公開され、それらを活用した最新のAIプロダクトが数多く開発されている。

一方日本においては、言語の壁の影響により関連するAI技術発展に乗り遅れ、最新のAI技術の恩恵を享受できていないという課題が存在しているという。情報処理推進機構(IPA)「AI白書2020」によると、すでにAIを導入している企業は4.2%、AI導入に興味はあるがまだ導入していない企業は78.3%という。

今後、最新のディープラーニング・モデルを日本語で扱うためには、莫大なGPUコストと時間のかかる日本語の追加学習が必要となり、その開発には一定の研究規模や開発環境が求められる。

そこで今回、東京大学 齊藤研究室とバベルが共同でAIエンジニアコミュニティAI Automation Lab(AIオートメーション・ラボ)で研究開発を行うことで、その開発の知見を日本で活躍するAIエンジニア・AI技術開発に携わる方々と共有し、さらにその成果となる日本語学習済みモデルをOSSとして無料公開することで、広く日本語ユーザーが最新AIモデルの恩恵を受けられる環境作りに貢献する。学術研究を含めて日本のAI分野の発展に寄与するとしている。

東京大学 齊藤研究室は、物理学と応用物理学の両者にまたがる量子物性の最先端の開拓を標榜し、次世代電子技術の基本物理原理を築く先端研究と世界で活躍する人材の輩出で科学技術と社会に貢献。スピントロニクス、量子ナノ系の研究に加え、最近では量子物理と情報物理を応用した新しいAI科学領域の研究を行っている。

バベルは、「世界中の人々の役に立つ事業を創り続ける」というミッションのもと、AI オートメーションを軸にユーザーエンゲージメントを最大化させ、ステークホルダー全員に感動を届ける事で世界をより良くするためにグローバルに事業展開している。

インテルのノートPC向けCPU市場シェアがAppleシリコンの影響で大きく落ち込む可能性、AMDはシェア堅持か

インテルのノートPC向けCPU市場シェアがAppleシリコンの影響で大きく落ち込む可能性、AMDはシェア堅持か

Apple

アップルがMacのプロセッサをインテル製から自社開発のAppleシリコンに2年かけて移行すると発表してから、1年以上が経過しました。その影響により、今後インテルのノートPC向けCPU市場シェアが大きく落ち込むとの予測が報じられています。

台湾の電子部品業界情報誌DigiTimesによると、M1チップを搭載した4台のMacとそれに続く(Appleシリコン搭載Mac)リリースにより、今年(2021年)のインテルはアップルからの受注のうち50%を失うとのこと。さらに、最終的にはアップルからの受注がゼロになることで、2023年にはインテルのノートPC向けプロセッサの市場シェアは80%を下回るとの見通しが述べられています。

そればかりか、アップルが自社開発した一連のArmベースプロセッサ(Appleシリコン)は、2022年にはインテルのシェアから大きな割合を奪う重要な役割を果たすとの情報筋の予想も伝えられています。

2023年にインテルのシェアが80%を下回るという概算は、具体的にはアップルに供給していた10%のシェアを失う一方で、AMDは10%のシェアを堅持するとの予想から。インテルはWindows PCやサーバー向けのCPU市場ではAMDとの熾烈なシェア争いを繰り広げる一方で、Macは一種の聖域ともなっていましたが、それが消え失せることは手痛い打撃となりそうです。

インテルはそうしたAppleシリコンが自社のビジネスに与える影響を認識しているようで、「Macにできないことがインテル製チップを搭載したPCにはできる」など複数のキャンペーンを展開しています。それに対しては結果的にインテル製CPUを採用した16インチMacBook Proを貶めていることや、MacがPCよりゲーム体験が劣るのはインテルと関係ない他社製GPUによるものではないかとの指摘もありました

現在のM1搭載Macは「低消費電力のわりに高性能かつ低価格」にこそ強みがあり、お金にも消費電力にも糸目を付けないインテル製チップ搭載のハイエンドPCにはピーク性能で及びません。が、32個もの高性能コアや128個ものGPUコアを搭載すると噂される次世代Appleシリコンが登場すれば、プロセッサ市場を一変させるゲームチェンジャーとなる可能性もありそうです。

(Source:DigiTimes。Via MacRumorsEngadget日本版より転載)

関連記事
米国の2021年第1四半期のPC出荷台数は73%増、Chromebookが好調
Intelが薄型軽量ノートPC向け第11世代Core新SKU2種と同社初の5Gモデム発表、バーチャルCOMPUTEX 2021で
【レビュー】アップルの24インチM1 iMac、明るい色とコンパクトさで「キュート」だが最重要ポイントは「M1」
【レビュー】アップルのiPad Pro 2021は今回もすばらしい、だが……
2021年第1四半期のChromebook出荷は前年同期比275%増の1200万台、パンデミックで好調維持
NVIDIAとMediaTekがChromium・Linux対応リファレンスプラットフォーム開発で連携、RTX GPUとArm採用ノートPCを示唆
6月公開予定のLinuxカーネル5.13がAppleシリコン「M1」搭載Macをサポート開始の可能性
M1搭載MacBook Airレビュー、新しい扉を開けたAirは多くの人におすすめできるAppleシリコンMac
​新型13インチMacBook Proは新M1チップ搭載し、13万4800円から
アップルがARMベースの独自SoC「Apple M1」を発表
PlayStation 5は5GB/秒超で容量825GBのSSD搭載、GPUはAMDのRDNA 2アーキテクチャ
次期「Xbox Series X」の新情報をマイクロソフトが発表

カテゴリー:ハードウェア
タグ:Apple / アップル(企業)Apple M1(製品・サービス)Appleシリコン / Apple Silicon(製品・サービス)Arm(企業)Intel / インテル(企業)NVIDIA(企業)AMD(企業)CPU(用語)GPU(用語)

AMDがテスラの新しいModel SとModel XがRDNA 2採用とCOMPUTEX 2021基調講演で発表

AMDがCOMPUTEX 2021基調講演でテスラの新しいModel SとModel XがRDNA 2採用と発表

AMD

テスラのアップデートされたModel SおよびModel Xはまるで飛行機の操縦桿のようになったハンドルやレバーを使わないシフト操作など、一般的な市販車の既成概念を打ち破る改変が盛り込まれています。

テスラ車の特徴でもある巨大なタッチスクリーンを採用したインフォテインメントシステムも新モデルではその性能を大幅に向上しており、1月の発表時にはその性能が10TFLOPSにものぼると宣伝されました。10TFLOPSといえば、PS5やXbox Series Xなどが搭載するGPUとほぼ同等の性能。もしやテスラはこの最新ゲーム機と同等のGPU機能を自動車に詰め込んだのでは…という憶測が流れていました。

そしてこのたび開催されたComputexの基調講演で、AMDのリサ・スーCEOは新しいModel S / Xについて語り、それらがAMDのAPU(Radeonグラフィックス機能を統合したCPU)を搭載していることを認めました。さらにそのGPUは憶測どおりRDNA 2を採用しているとのこと。

ただし、車載インフォテインメントシステムという用途上、そのGPU性能は常に利用するのではなく、なにか高負荷な処理が必要とされるときだけ作動するようになっているとのこと。おそらくそれは車内でゲームをプレイするとき…というのがまっさきに思い浮かぶところですが、それ以外にも17インチの巨大なタッチスクリーンに加え、新しいテスラが搭載する後部座席用ディスプレイを同時に使う際などにも活躍しそうです。

ちなみに、ゲーム好きな著名人の中には、移動用の車両の後部座席にモニターとゲーム機を持ち込んでプレイする人もいるそうですが、そのような方々なら経済的な心配はいらなそうなので、多少値が張ってもModel SやModel Xを次に購入する愛車に検討してみても良いかもしれません。

(Source: AMD(Youtube)Engadget日本版より転載)

関連記事
Intelが薄型軽量ノートPC向け第11世代Core新SKU2種と同社初の5Gモデム発表、バーチャルCOMPUTEX 2021で
テスラが車内カメラでAutopilot使用中のドライバーを監視
テスラの北米向けModel 3とModel Yがレーダー非搭載に
RDNAアーキテクチャのモバイル向けGPU「Radeon RX 5000M」でライバルを追撃するAMD
PlayStation 5は5GB/秒超で容量825GBのSSD搭載、GPUはAMDのRDNA 2アーキテクチャ

カテゴリー:モビリティ
タグ:RDNAAMD(企業)COMPUTEX(イベント)COMPUTEX 2021(イベント)GPU(用語)Tesla / テスラ(企業)

NVIDIAとMediaTekがChromium・Linux対応リファレンスプラットフォーム開発で連携、RTX GPUとArm採用ノートPCを示唆

NVIDIAとMediaTekがRTX GPUとArm組み合わせたノートPCを示唆、Chromium・Linux対応リファレンスプラットフォーム作成で連携

米NVIDIAと台湾MediaTekは、リファレンスラップトップのプラットフォームを共同開発すると発表しました。

今回の提携で、両社はChromium、Linux、NVIDIA SDK(ソフトウェア開発キット)をサポートするラップトップ(Chromebookかどうかはわかりません)を開発します。現時点では具体的な製品仕様や投入時期などは明らかになっていませんが、NVIDIAによれば「RTX GPUとARMアーキテクチャの組み合わせにより、リアルなレイトレースグラフィックと最先端のAI(人工知能)をラップトップに導入する」ことを目標としています。

Nintendo Switchや車載インフォテイメントシステムに採用されている「Tegra」シリーズなど、NVIDIAはすでにARMベースのプロセッサを多数市場へ投入しています。さらに同社は12日に開催した年次カンファレンス「GTC 2021」にて、ARMベースのデータセンター向けプロセッサ「Grace」を発表しました。こちらはAIスーパーコンピューティングや自然言語処理など、大規模なデータ処理を対象とした製品。

MediaTekのプロセッサはハイエンドスマートフォンではあまり見かけないものの、2020年第3四半期にはシェアで米クアルコムを追い抜くなど、着実にその勢力を伸ばしています。またローエンドからミッドレンジ向け製品が中心のMediaTek製プロセッサですが、RTX GPUの技術が加わることにより、一挙にハイエンド級のパフォーマンスを達成することも期待できそうです。

PC向けプロセッサメーカーの話題としては、韓国サムスンとAMDが協力しAMD製GPUを搭載したラップトップ向けプロセッサを投入するとの観測も登場しています。NVIDIAは2020年にソフトバンクグループからARMを買収しており、今後もARMアーキテクチャへさらなる経営資源の投入を進める可能性があります。

(Source:NVIDIAEngadget日本版より転載)

関連記事
NVIDIAがArmベースのデータセンター用CPU「Grace」発表、2023年に搭載システム立ち上げ予定
6月公開予定のLinuxカーネル5.13がAppleシリコン「M1」搭載Macをサポート開始の可能性
5万800円の2 in 1タイプChromebook「ASUS Detachable CM3」発売、ペンも収納可能

カテゴリー:ハードウェア
タグ:Arm(企業)NVIDIA(企業)オープンソース / Open Source(用語)Chromium(製品)Chromebook(製品・サービス)GTC / GPU Technology ConferenceGPU(用語)MediaTek(企業)Linux(製品・サービス)

AIチャットボット「りんな」を手がけるrinnaが日本語特化のGPT-2大規模言語モデルをオープンソース化

AIチャットボット「りんな」を手がけるrinnaが日本語特化のGPT-2大規模言語モデルをオープンソース化

AIチャットボット「りんな」などを手がけるrinna(リンナ)は4月7日、日本語に特化したGPT-2の大規模言語モデルを構築し、GitHubおよびNLPモデルライブラリー「HuggingFace」において、トレーニングコードと言語モデルをオープンソースソフトウェアとして公開した。

また今回公開したモデルは、GPT2-mediumと定義される中規模サイズのものという。今後、パフォーマンスとコストのトレードオフに基づいてユーザーおよび研究者が最善の選択を行えるよう、異なるサイズのモデルも公開する予定。異なるデータでトレーニングした新しいモデルの公開も計画している。

rinnaの研究チームが開発している大規模な言語モデルは、すでに同社プロダクトに広く使用されているという。同社は今後も、異なるテキストスタイルや異なるデータ量を含む、より高精度でより大規模な言語モデルの研究開発を続け、AIチャットボットの能力を高めるとしている。また、日本語の研究コミュニティのために、これらのモデルのオープンソース化を行う。

日本語GPT-2モデルの機能

言語モデルとは、言語データの機械学習を基に、会話や文章の「人間が使う言葉らしさ」を確率としてモデル化したもの。GPT-2の場合は、単語レベルの確率の組み合わせから文の確率を計算する言語モデル(自己回帰言語モデル)を採用している。

例えば、「確率(吾輩は猫である) = 確率(吾輩) × 確率(は|吾輩) x 確率(猫|吾輩,は) × 確率(で|吾輩,は,猫) × 確率(ある|吾輩,は,猫,で)」のような方法で推定を行う。この能力を使って、GPT-2は「吾輩は猫で」という接頭辞(Prefix)を与えられたとき、確率の推定から次にくる単語として「ある」を選択し、文章を自動生成する。

今回rinnaが公開した日本語GPT-2モデルは、一般的な日本語テキストの特徴を有した高度な日本語文章を自動生成できる。ユーザーおよび研究者は、特定のテキストデータを微調整して、このモデルから独自のモデルを作成することも可能としている。

例えば、Prefixとして「誰も到達していない人工知能の高みへ、ともに」という文章が与えられたとき、特定のコンテキスト(デモ1:講演の感想、デモ2:書籍の紹介)で応答文を生成するように、微調整できるという(掲載した画像のデモは生成する文章の文字数上限を設定しており、実際に生成される全文ではない)。

デモ1:講演の感想のコンテキストで文章生成

デモ1:講演の感想のコンテキストで文章生成

デモ2:書籍の紹介のコンテキストで文章生成

デモ2:書籍の紹介のコンテキストで文章生成

rinnaの日本語GPT-2モデルの特徴

rinnaの日本語GPT-2モデルは、トレーニングデータとしてCC-100のオープンソースデータを使用しているという。

またNVIDIA「Tesla V100 GPU」を用いて、70ギガバイトの日本語テキストを約1カ月の長期間にわたってトレーニングしたそうだ。その結果同モデルは、約18 perplexityという性能を達成した。この「18perplexity」は、GPT-2モデルが前に与えられた単語から次の単語を予測するときに、正しいものを含む18のオプションだけを残せるという性能を意味するという。モデルは十分にトレーニングされており、汎用性があるとしている。

rinnaは、Microsoft(マイクロソフト)のAI&リサーチ部門でAIチャットボットの研究を行っていたチームがスピンアウトして2020年6月に設立したAI開発企業。ディープラーニング技術を活用し、AIが文脈に応じた会話文を自動生成して人間と自然に会話する「共感チャットモデル」、AIが話し声や歌声で豊かな感情表現を可能にする「音声合成システム」などの技術を発表している。

これらの最新技術は、同社運営のAIチャットボット「りんな」や、会話内容や音声表現をカスタマイズしてキャラクター性を持たせたAIチャットボット「AIキャラクター」の開発に応用しており、企業のマーケティングなどに採用されているという。

同社は、製品開発のための自然言語処理(NLP)の実験過程で、日本語に特化したGPT-2の大規模言語モデルを構築。日本語のNLP研究コミュニティに貢献するために、開発した言語モデルと、研究者が自分のマシンで実験結果を再現するためのトレーニングコードを、GitHub、およびNLPモデルライブラリHuggingFaceで、オープンソースとして公開した。

関連記事
ウイルスの突然変異予測からClubhouse話者識別まで、今、人工知能に期待されていること
Copy.aiのAI利用記事作成システムは「使える」レベルの驚異的な出来、日本語も対応
テキストアドベンチャー「AI Dungeon」のLatitudeが「無限の物語」を生み出すゲーム制作のために3.5億円調達
OpenAIのDALL-Eは言葉による指示で「それらしい」画像を作り出す
LINEがOpenAI「GPT」・Google「T5」同様の超巨大汎用言語モデルをNAVERと共同開発、世界初の日本語特化
日本語音声合成向けに東京式アクセントを自動推定する自然言語処理ソフト「tdmelodic」がオープンソース化
OpenAIがテキストベースのAI機能利用が簡単になる汎用APIを開発
マイクロソフトはOpenAIと協力してAzure上に世界第5位となるスーパーコンピューターを構築
OpenAIは非常に優れたテキストジェネレータを開発したが、そのままリリースするのは危険すぎると考えている

カテゴリー:人工知能・AI
タグ:OpenAI(組織)自然言語処理 / NLP(用語)GPT / Generative Pretrained TransformeGPU(用語)ディープラーニング / 深層学習(用語)Microsoft / マイクロソフト(企業)日本(国・地域)

NVIDIAがGeForce RTX 3060での暗号資産マイニング効率を半分に制限、採掘専用GPU発表

NVIDIAが暗号通貨イーサリアムに関してRTX 3060を使ったマイニング効率を本来の半分に絞っていることを明らかにしました。理由は、RTX 3060がゲーム向けのGPUであるにもかかわらず、高性能であるがために暗号通貨マイナーたちが買い占めてしまうのを防止するため。

NVIDIAはブログ記事で「RTX 3060ソフトウェアドライバーは、イーサリアム暗号通貨マイニングアルゴリズムの特定の属性を検出し、ハッシュレートもしくは暗号通貨マイニング効率を約50%に制限するよう設計されています」と述べ「GeForce RTX GPUはリアルタイムレイトレーシング、DLSS AIアクセラレーション、画像アップスケーリングテクノロジー、Reflex超高速応答レンダリングなどゲームやその他のデジタルエクスペリエンスを生み出す人々のニーズにあわせた最先端技術を導入している」としました。

暗号通貨マイニング人口の世界的な増加はNVIDIAの売り上げには良かったものの、CPUに統合されたグラフィックス機能よりも高い性能を必要とするゲーマーやAI研究者には、品薄という困った事態を引き起こしました。

そしてNVIDIAは今回、イーサリアムマイニングという特定のニーズのために、NVIDIA CMP(Cryptocurrency Mining Processor)という暗号通貨マイニング専用製品を新たに発表しました。CMP製品はマイニングに特化した製品のためディスプレイ出力を備えません。ラインナップはハッシュレート26MH/s、6GBメモリーを備え、定格電力125Wの「30HX」、36MH/s、8GB、185Wの「40HX」、45MH/s、10GB、250Wの「50HX」、86MH/s、10GB、320 Wの「90HX」の4種類。発売時期は下位2モデルが今四半期、残りの上位2モデルが第2四半期に予定されています。

  1. NVIDIAがGeForce RTX 3060での暗号資産マイニングの効率を半分に制限、採掘専用GPU発表

    NVIDIA

暗号通貨の採掘目的で、RTX 3060が発売される2月25日を指折り数えて待っていた人たちには、今回の発表はつまらない話かもしれません。しかし、ゲーム向けのグラフィックカードはゲームのために使うのが本来の用途です。マイニング専用の製品投入は、ゲーマーたちがいつまでたっても最新のGPUを入手できない問題を解決するかもしれません。

(Source:NVIDIAEngadget日本版より転載)

関連記事
フィックスターズ独自開発の視差計算ソフトがOpenCVに正式実装、自動運転などへの活用に期待
モバイルdGPUの最高峰NVIDIA「GeForce RTX 2080 SUPER」とコスパに優れるAMD「Radeon RX 5500M」を試す
NvidiaはGPUを使ったゲノム分析ツールキットを新型コロナ研究者に無料で提供

カテゴリー:ハードウェア
タグ:暗号資産 / 仮想通貨(用語)Ethereum(製品・サービス)NVIDIA(企業)NVIDIA CMP(製品・サービス)ゲーム(用語)GeForce RTX(製品・サービス)GPU(用語)ブロックチェーン(用語)日本(国・地域)