たった1枚あればいい! モナリザに命を吹き込んだ「AI技術」への期待と懸念

AI 国際

ink_pen 2019/7/11

佐藤まきこ

さとうまきこ

大学時代に細胞培養の研究を専攻した後、メディア･広告の世界へ。雑誌編集者や広告のプランナー、コピーライターとして長年経験を積み、フリーランスのプランナー、エディターとして活動中。ハワイ、オアフ島在住。Instagram: @hawaii_milestone

もっと見る arrow_forward

レオナルド・ダビンチの絵画「モナリザ」が、まるで生きている女性のように表情豊かに話しだした……。

世界中の人々が驚き、思わず二度見してしまったのが、そんなモナリザに命を吹き込んだAI技術です。サムスンAIセンター・モスクワの研究者たちが発表した、顔の静止画から人が話している動画を作る技術とは一体どんなものなのでしょうか?

動画データを長時間にわたってメタ学習

これまでにも、人が話したり笑ったりする表情を作る技術はありましたが、そのためには同じ人物の表情に関する大量のデータを機械が学習することが必要でした。しかし、サムスンAIセンター・モスクワの研究者たちが発表したこの方法では、ある人物の静止画像がたった1枚あれば、その人があたかも話しているような動画を作れてしまうのです。

なぜそんなことが可能なのかというと、膨大な量の動画データを長時間にわたりメタ学習（機械学習においてアルゴリズムが学習方法を学ぶこと）させ、初めて見る人物の顔画像でも、その人の顔が動く動画を作れるようにしたから。データにはない人物の顔であっても、その人の表情がリアルに動くような顔モデルを生成することができるのです。

さらに、この新技術はGenerative Adversarial Network（GAN、敵対的生成ネットワーク）も使用。これにより、様々に生成された顔モデルを互いに比較して、よりリアルなモデルを生成します。だから、モナリザのほかにもアインシュタインやマリリンモンローなど、もうこの世には存在しない人物であっても、同じように顔を写した1枚の画像があれば、そこから話している動画を作成できるんですね。