OpenAI 引入新工具,以加速AI音响助理的开发

雅加达 - 微软支持的人工智能公司OpenAI于9月1日星期二推出了一系列新工具,旨在使开发人员更容易构建基于AI的应用程序。这一步是在与谷歌和Alphabet等科技巨头日益激烈的竞争中进行的,这些科技巨头也在开发日益先进的生成AI技术。

引入的新工具之一是实时系统,允许开发人员更轻松地生成AI音频应用程序。使用此工具,开发人员只需使用一套指示即可创建以前至少需要分三步的应用程序:首先,音频转录,然后运行文本模型以提供问题的答案,最后使用文本对语音模型将文本转换为语音。预计这种简化的过程将加速开发时间,并降低希望利用音频AI技术的公司成本。

OpenAI已成为人工智能行业的主要参与者之一,其大部分收入来自使用公司服务来构建自己的AI应用程序的企业。通过引入这些先进的功能,OpenAI希望进一步加强其在竞争市场中的地位。

生成AI行业的竞争日益激烈,谷歌等其他科技巨头的努力也加剧了竞争,谷歌也集成了其AI模型,以处理各种形式的信息,包括视频,音频和文本。这使得OpenAI面临着不断创新的压力,并为开发人员带来了更高效的解决方案。

路透社报道称,OpenAI预计到2025年将其收入增加至116亿美元(177.3万亿印尼盾),大大高于2024年的估计37亿美元(56.5万亿印尼盾)。此外,该公司还面临筹款金额为65亿美元(99.3万亿印尼盾),有可能将其估值提高至1500亿美元(2.2万亿印尼盾)。

即期配音 和速率缓冲 功能

作为新工具推出的一部分,OpenAI还引入了一项精细编织功能,允许开发人员根据图像和文本改进AI模型产生的响应。这些精细编织涉及人类的反馈,为模型提供良好和不良响应的例子,以便人工智能可以学习提供更相关,更准确的答案。

使用图像来改进模型,人工智能可以具有更好的视觉理解,这可以在多种应用中使用,例如自动驾驶车辆上更先进的视觉搜索和更准确的物体检测。

此外,OpenAI还推出了“高推缓描”工具,可以将开发成本削减一半。此工具允许开发人员重复使用 AI 以前处理的文本部分,从而使应用创建流程更加高效。

人工智能技术的快速发展中,人们对监管及其对用户隐私和安全的影响感到担忧。OpenAI和其他科技公司必须适应日益严格的法规,特别是在人工智能模型运行中的数据使用和透明度方面。

然而,OpenAI仍然乐观地认为,他们的创新将继续鼓励各个领域的人工智能技术的进步,包括开发日益复杂和用户友好的语音应用。

新工具推出后,OpenAI希望继续为世界各地的开发人员提供更快,更高效,更易于访问的AI解决方案,同时保持其地位在生成AI技术竞争的巅峰。