谷歌发布Veo 3、AI 视频生成器 现在配备自动音频
雅加达 - 谷歌在本周的Google I / O活动中正式推出了最新的AI基于视频生成型型Veo 3。Veo 3的出色功能之一是它能够生成自动音频——背景音声、对话和语音效果——而不需要用户的语音输入。这标志着生成技术的巨大飞跃,同时引起了技术观察家的各种反应。
拥有10多年的经验的科技记者Allison Johnson撰写的一篇评论中,Veo 3被称为“AI插头发动机”,因为它有能力产生非常逼真的视觉和音频内容,尽管它并不总是相关或符合用户的意愿。约翰逊指出,当他尝试使用简单的文本促销创建视频时,Veo 3可以添加一个从未被要求过的对话 - 具有相当有说服力的身体和气氛的运动。
例如,在Space Needle上拍摄有关火灾的视频时,该AI不仅具有灾难视觉显示,而且还添加了一个新闻主持人,他用逼真的声音和语音背景提交了事件报告。
哈佛法学院(Harvard Law School)的教官Alejandra Caraballo也做了同样的事情,他设法制作了一个假新闻主持人视频,宣布美国国防部长皮特·海格斯(Pete Hegseth)死亡 - 即使这个人物还活着。
谷歌声称在使用Veo 3 时已实施限制和防守眼镜。例如,用户无法制作有关总统垮台,公职人物被暗杀或技术首席执行官在金钱下雨中嘲笑的视频。然而,约翰逊断言,没有任何漏洞或具体的技巧,用户仍然可以制作可能具有误导性的视频,例如虚假的自然灾害或虚构事件,就好像由官方新闻机构提交一样。
然而,Veo 3 无法用于直接创建个人Deepfake。当约翰逊尝试使用他使用特定对话的照片创建视频时,系统拒绝处理。然而,对于儿童漫画视频等简单内容,Veo 3 非常有效。他能够在几分钟内创建类似于儿童YouTube内容的视频 - 一辆怪物卡车滑入丰富多彩的油漆,配有音乐和语音效果。
约翰逊最大的担忧恰好出现在他试图制作一段捕鱼的两只漫画猫的视频时。在促销中不包括对话的情况下,人工智能仍然在猫之间产生听起来很自然的对话。从这里开始了一个大问题:如果你这么简单地制作了一段短视频,人们还需要多长时间才能开始制作一段长视频,其中包含仅使用人工智能的误导性信息?
目前,想要延长的视频将被返回Veo 2 系统,该系统不支持自动音频功能。然而,随着谷歌技术发展的加速,许多人认为全期AI视频很快就会成真。
谷歌本身通过展示Eliza McNitt和著名导演Darren Aronofsky的合作,展示了这项技术的积极潜力,他正在开发一部带有AI视频元素的电影。
然而,艾利森·约翰逊(Allison Johnson)以批评的语气结束了他的报道。据他介绍,Veo 3不如制作高质量的电影作品,更有可能被用来用生成和空心内容淹没互联网,这些内容现在变得更加容易——使用人工智能制造的图像,动作和声音。