OpenAI 进行新克隆音频工具的试验以共享语言
雅加达 - ChatGPT背后的公司OpenAI宣布,它正在对其新的名为语音引擎的人工智能(AI)技术工具进行小规模试验。
「语音引擎是我们致力于理解技术界限和公开分享人工智能可以做些什么的承诺的延续,”OpenAI在3月31日星期日引用的官方公告中写道。
由于仍处于小规模预览状态,因此该语音引擎可以将15秒音频克隆到与原始音频不同的语言,包括日本语,西班牙语,葡萄牙语,普通语,德语和法语,听力结果非常自然。
We're sharing our learnings from a small-scale preview of Voice Engine, a model which uses text input and a single 15-second audio sample to generate natural-sounding speech that closely resembles the original speaker. https://t.co/yLsfGaVtrZ
— OpenAI (@OpenAI) March 29, 2024
We're sharing our learnings from a small-scale preview of Voice Engine, a model which uses text input and a single 15-second audio sample to generate natural-sounding speech that closely resembles the original speaker. https://t.co/yLsfGaVtrZ
语音引擎工具于2022年底首次开发,并已将其用于支持文本对语音API以及ChatGPT Voice和Reading Aloud中可用的预设置声音。
虽然有可能滥用合成声音或人工智能产生的声音,但OpenAI希望这个工具能够被公众负责任地使用,并能够适应这些新功能。
理解即将出现的严重风险,OpenAI声称已与来自政府,媒体,娱乐,教育,民间社会等各界的美国和国际伙伴合作,以确保该工具的安全制造。
“今天测试Voice Engine的合作伙伴已同意我们的使用政策,禁止在没有批准或合法权利的情况下模仿个人或其他组织的身份,”该公司补充说。
最后,OpenAI百万实施了一系列安全措施,包括提供水标以跟踪语音引擎生成的任何音频的起源,以及主动监控其使用方式。
但是,OpenAI没有提到何时向用户广泛发布此新工具。因此,让我们等待未来的下一个信息。