Googleが「Veo 3」をリリースし、現在自動オーディオを搭載したビデオジェネレータAIをリリース

Googleは今週、Google I / Oイベントで、最新のAIベースのビデオジェネレーティブモデルであるVeo 3を正式に発売しました。Veo 3の主な特徴の1つは、ユーザーからの音声入力を必要とせずに、バックグラウンドサウンド、ダイアログ、音声エフェクトの両方を含む自動オーディオを生成する機能です。これは、ジェネレーティブ技術の大きな飛躍を示し、テクノロジーオブザーバーからの様々な反応を引き起こします。

10年以上の経験を持つテクノロジージャーナリストのアリソン・ジョンソンが書いたレビューで、Veo 3は、常に関連しているわけでも、ユーザーの希望に合致するわけでもない、非常に現実的なビジュアルおよびオーディオコンテンツを生成する能力のために、「AIスロップマシン」と呼ばれています。ジョンソンは、シンプルなテキストプロンプトを使用してビデオを作成しようとすると、Veo 3は、身体の動きと非常に説得力のある雰囲気で、決して要求されない対話を追加できると指摘しています。

たとえば、スペースニードルで火災に関するビデオを作成するとき、このAIは災害のビジュアルを表示するだけでなく、現実的な音と背景音でイベントレポートを提供するニュースキャスターを追加します。

ハーバード大学ロースクールのインストラクター、アレハンドラ・カラバロも同じことをしましたが、彼は、キャラクターがまだ生きていたにもかかわらず、米国国防長官ピート・ヘルセスの死を発表したニュースキャリアの偽のビデオを作成することができました。

Googleは、Veo 3 の使用に制限とガードレールを実装したと主張しています。たとえば、ユーザーは、大統領の転倒、著名人の殺害、または金銭の雨の中で笑うテクノロジーのCEOについてのビデオを作成することはできません。しかし、ジョンソン氏は、抜け穴や特定のトリックがなければ、ユーザーは偽の自然災害や公式の報道機関によって伝えられたかのように見える架空のイベントなど、誤解を招く可能性のあるビデオを作成できると主張しています。

Veo 3は、パーソナルディープフェイクを直接作成するために使用することはできません。ジョンソンが特定の対話で自分の写真を使ってビデオを作成しようとしたとき、システムはそれを処理することを拒否しました。ただし、子供向けの漫画動画などのシンプルなコンテンツについては、Veo 3が非常に効果的です。彼はYouTube Kidsのコンテンツに似たビデオを作成することができました - 音楽と音声効果を備えたカラフルなペイントに滑り込むモンスタートラック - ほんの数分で。

ジョンソンの最大の懸念は、彼が釣りをしている2匹の漫画猫のビデオを作ろうとしたときに実際に起こりました。プロンプトに対話を含めることなく、AIは自然に聞こえる猫間の会話を生成します。このように簡単に短いビデオを作るのに、AIだけで誤解を招く情報だけを含む長いビデオの制作を始めるのにどれくらいの時間がかかりますか?

今のところ、長さを延長したいビデオは、まだ自動オーディオ機能をサポートしていないVeo 2システムに戻されます。しかし、Googleによる技術開発のペースで、多くの人が本格的なAIビデオがすぐに実現すると信じています。

Google自身も、エリザ・マクニットと、AIビデオ要素を含む映画を開発している有名な監督ダレン・アロノフスキーとのコラボレーションの結果を示すことで、この技術の肯定的な可能性を示しています。

それにもかかわらず、アリソン・ジョンソンは批判的な口調で報告書を締めくくった。彼によると、Veo 3は、高品質の映画作品を制作する代わりに、AI製の画像、動き、サウンドで、一般的で機知に富んだコンテンツでインターネットを濫させるために使用される可能性が最も高いです。