雅加达 - 最近的报道显示,苹果已使用YouTube视频来训练其AI模型Apple Intelligence。据说这是平台内容政策的违规行为。

与Wired共同发表的Proof News进行的调查指出,苹果和包括Nvidia和Anthropic在内的其他几家科技公司正在使用用户生成的公开可用数据来训练他们的AI模型。

根据调查,苹果使用了一种名为YouTube Subtitles的数据库,其中包括来自48,000多个频道的173,536个YouTube视频的转录。该数据库中的视频涵盖了各种类型的内容,从汗学院和麻省理工学院等教育渠道,到华尔街日报等新闻网站,以及该平台上的一些知名创作者,如MrBeast和Marques Brownlee。

Marques Brownlee表示,苹果在技术上避免了错误,因为他们从使用YouTube视频的转述而不是直接使用数据的公司获得了他们的AI。然而,这些数据和转述仍然有助于人工智能模型,创作者已经投入了他们的时间和金钱。Brownlee断言,这将是一个长期存在的问题。

Proof News还为创作者创建了一个工具,用于在数据库中搜索其内容。Subtitles YouTube数据不包括来自视频的图像,但包括一些以多种语言翻译的字幕。据报道,该数据库是由一个名为Eleuther AI的非营利性研究实验室创建的,该实验室专注于促进公开的科学规范。

本报告中没有一家公司立即就此事发表评论。YouTube首席执行官尼尔·莫汉(Neal Mohan)在接受采访时明确表示,使用YouTube视频来训练其AI模型的公司是“明显违反”该平台政策的。


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)