米メタ(旧:フェイスブック)は、200言語を翻訳できるAI(人工知能)モデル「NLLB-200」をオープンソース化すると発表しました。
近年、VRヘッドセットを含めたメタバース事業で話題を集めているメタですが、その一方で同社は半年前から「No Language Left Behind(NLLB)」プロジェクトに取り組んでいます。これは、英語を介することなく多数の言語をシームレスに翻訳できるAIを開発することを目的としており、ラオス語やカンバ語など、アジアやアフリカのあまり広く使われていない言語も含まれています。
メタによれば、このAIモデルであるNLLB-200は、アフリカで話されている55言語の翻訳において「高品質な結果」を得ることができたとのこと。また、ベンチマーク「FLORES-101」では、NLLB-200は既存の最先端翻訳モデルの性能を平均44%上回り、アフリカとインドの特定の方言では70%もの差をつけたことも伝えられています。
これまで、英語でない言語の翻訳はAIにとって大きな課題でした。これは、翻訳システムの多くがインターネットから収集した文章データ(英語)に依存していることが主な原因です。
メタは「お気に入りのFacebookグループを訪れ、イボ語やルガンダ語の投稿をボタンをクリックするだけで、自分の言語で理解できることを想像してみてください」と投稿して、NLLB-200の価値をアピール。さらに、同技術の応用を開発する非営利団体に20万ドル(約2700万円※)の助成金を提供するとも発表しています。
※1ドル=約135.7円で換算(2022年7月7日現在)
近年はAIを利用した翻訳エンジンが数多く登場していますが、NLLB-200の登場により、その勢いはさらに加速することになりそうです。