AIの進化でモナリザが喋り出す？サムスンらが開発した「1枚の写真から動画を作る」最新技術の衝撃

2019年07月07日、テクノロジー界を揺るがす驚きのニュースが飛び込んできました。韓国のサムスン電子がモスクワに構える人工知能（AI）センターと、ロシアのスコルコボ科学技術大学の研究グループが、たった1枚の静止画から「生きて動いているような動画」を生成する画期的な技術を開発したのです。

この技術の凄さは、私たちが普段スマートフォンで撮影する顔写真だけでなく、数百年前に描かれた歴史的な絵画にも適用できる点にあります。研究チームは、レオナルド・ダ・ヴィンチの傑作「モナ・リザ」を用いてデモンストレーションを行い、あの神秘的な微笑みを浮かべる女性が、まるで実在の人物のように目や口を動かして話す様子を再現することに成功しました。

今回の開発で中心的な役割を果たしたのが、現代のAIにおける中核技術である「機械学習（マシンラーニング）」です。これは、コンピューターが大量のデータを読み込むことで、特定のルールやパターンを自ら学習していく仕組みを指します。今回のケースでは、数多くの人間の顔の動きをあらかじめ学ばせることで、未知の1枚からでも自然な表情を予測できるように構成されています。

具体的には、AIが画像の中から眉や目、鼻、口、そして顎といった各パーツの特徴を瞬時に捉え、顔の骨格にあたる「フレームワーク（枠組み）」を構築します。この土台があるからこそ、元の画像には存在しない「横を向く」といった動作や、複雑な発話時の口の形を、違和感なく合成することが可能になるのでしょう。SNS上では「魔法のようだ」「偽物と見分けがつかなくなるのが怖い」といった驚嘆と懸念が入り混じった声が相次いでいます。

編集者の視点から見れば、この技術はエンターテインメントやビデオ会議のあり方を根本から変える可能性を秘めていると感じます。例えば、亡くなった著名人や歴史上の人物と対面しているかのような体験も、今や夢物語ではありません。しかし同時に、本物と見紛う偽動画「ディープフェイク」の悪用に対する議論も避けて通れないはずです。技術の進歩を享受しつつ、私たちは情報の真偽を見極める新たなリテラシーを求められていると言えるのではないでしょうか。

関連投稿:

コメント