Wav2vec | SEO-LPO.net

東京大学齊藤研究室とバベルがAIエンジニアコミュニティ設立、wav2vec 2.0利用し日本語関連OSSプロジェクト開始

AIオートメーション技術を軸にグローバルで事業展開を行うバベルは8月24日、東京大学大学院工学系研究科齊藤研究室（東京大学齊藤研究室）と、誰でも参加可能なAIエンジニアコミュニティ「AI Automation Lab」（AIオートメーション・ラボ）を設立。日本語学習済みAIモデルのオープンソースソフトウェア（OSS）化を前提とする日本語音声書き起こし・会話の解析技術の共同研究を開始したと発表した。ベースとなるモデルとして、音声認識フレームワーク「wav2vec 2.0」を利用し、日本語に合わせて調整する。

wav2vec 2.0と呼ばれる書き起こしのモデルは、大規模なラベルなしデータを利用した事前学習を行うことで、少数のラベル付きデータセットでも高精度の書き起こしが可能という。日本語のような少数派の言語では、大規模なラベル付きデータを学習に利用することが困難な状況なものの、wav2vec 2.0はまさにそのような状況にある言語に適しているとした。

AI Automation Labには、connpass上の「AI Automation Lab（AI オートメーション・ラボ）」より参加できる。

昨今「音声書き起こし」に関する技術は全世界で著しく発展しており、英語や中国語を中心とした各国の言語に対して、wav2vec 2.0などの最新の学習済みAIモデルがOSSで公開され、それらを活用した最新のAIプロダクトが数多く開発されている。

一方日本においては、言語の壁の影響により関連するAI技術発展に乗り遅れ、最新のAI技術の恩恵を享受できていないという課題が存在しているという。情報処理推進機構（IPA）「AI白書2020」によると、すでにAIを導入している企業は4.2％、AI導入に興味はあるがまだ導入していない企業は78.3％という。

今後、最新のディープラーニング・モデルを日本語で扱うためには、莫大なGPUコストと時間のかかる日本語の追加学習が必要となり、その開発には一定の研究規模や開発環境が求められる。

そこで今回、東京大学齊藤研究室とバベルが共同でAIエンジニアコミュニティAI Automation Lab（AIオートメーション・ラボ）で研究開発を行うことで、その開発の知見を日本で活躍するAIエンジニア・AI技術開発に携わる方々と共有し、さらにその成果となる日本語学習済みモデルをOSSとして無料公開することで、広く日本語ユーザーが最新AIモデルの恩恵を受けられる環境作りに貢献する。学術研究を含めて日本のAI分野の発展に寄与するとしている。

東京大学齊藤研究室は、物理学と応用物理学の両者にまたがる量子物性の最先端の開拓を標榜し、次世代電子技術の基本物理原理を築く先端研究と世界で活躍する人材の輩出で科学技術と社会に貢献。スピントロニクス、量子ナノ系の研究に加え、最近では量子物理と情報物理を応用した新しいAI科学領域の研究を行っている。

バベルは、「世界中の人々の役に立つ事業を創り続ける」というミッションのもと、AI オートメーションを軸にユーザーエンゲージメントを最大化させ、ステークホルダー全員に感動を届ける事で世界をより良くするためにグローバルに事業展開している。