OpenAI 分享了防止用户数据访问 Web 翼的方法

雅加达 - OpenAI 现在为用户提供了阻止 Web 过滤器的能力,该功能旨在不乱用网站以帮助练习GPT等大语言模型(LLM)。

被称为GPTBot,是一种梳理互联网以训练和提高更大人工智能(AI)能力的系统。

使用此工具,有可能在各个方面、准确性和安全性方面改进现有的人工智能模型。

OpenAI表示:“与GPTBot用户代理商一起回收的Web内存有可能被用来完善即将到来的模型和过滤器,以删除需要 paywall 访问的源头。

“它被认为是收集个人身份信息(PII)或包含违反我们政策的文本,”他补充说。

但是,网站可以选择限制访问 Web 界面,并阻止 GPTBot 部分或完全删除它们。

“允许GPTBot访问您的网站可以帮助人工智能模型更加准确,并提高其整体能力和安全性,”OpenAI说。

根据OpenAI的说法,网站运营商可以通过阻止其IP地址或使用 Robot.txt 将其添加到网站来禁止箭头,这是基本上一个文本文件,指示他们可以或无法访问的内容。

操作员还可以通过允许特定页面并禁止其他页面来定制哪些部分来定制 Web 帆船。

8月8日星期二推出The Verge,众所周知,互联网为LLM提供了大量的培训数据,例如OpenAI拥有的GPT模型,Bard拥有的Google。

不幸的是,OpenAI本身尚未确认该公司是否通过社交媒体上传、版权作品或互联网上任何部分获取信息。