D-ID、音声アバター動画が作れる「Creative Reality Studio」12/13発表 画像とテキストだけで誰でも制作可能

LINEで送る
Pocket

AI技術などを扱うイスラエルの企業・D-IDは現地時間の12月13日、 画像とテキストでアニメーションを生成し、アバターに読み上げさせるジェネレーティブAIのビデオプラットフォーム「Creative Reality Studio」を発表した。

本技術では、テキストの読み上げには「GPT-3」、アバター生成には「Stable Diffusion」をそれぞれ使用。ユーザーの記述を元に顔や文章を自動合成し、その顔をアニメーションとして動かしながら、119の言語でテキストを読み上げ、動画コンテンツを作ることが可能だ。

今までのバーチャルヒューマンやVTuberなどでは、アバター自体の用意や音声収録など、準備段階のハードルが高かった。しかし、本技術を利用すると、誰でもすぐに音声動画を作ることができるそうだ。

人物が説明を行う研修動画や自己紹介のビデオなどを手軽に作成できることから、企業だけでなく、個人も対象にリリースされ、発表後は自撮りを元にしたアバターで音声付きの動画を作り、SNSに投稿を行う一般ユーザーもいた。

D-IDは2017年に設立。2022年7月にも、動画コンテンツ制作のソリューション「Deep Nostalgia 」を発表し、亡くなった人や歴史上の人物の写真を動かす動画を作れることで話題になった。

D-IDのCEO兼共同創業者であるギル・ペリー氏は、「クリエイティブなジェネレーティブAI技術の可能性はまだ始まったばかりで、これから世界を席巻していくでしょう。我々は、画像やテキストをアニメーションとともに生成し、無限のクリエイティブな可能性を提供する最初のプラットフォームを導入し、新たなジェネレーティブAIシーンの最先端にいることを大変誇りに感じています。 ユーザーの皆様の成果が楽しみです」と語った。

●関連リンク
D-ID(YouTube)