OpenAIは、ユーザーデータへのウェブアクセスを保護する方法を共有します

ジャカルタ-OpenAIは現在、GPTなどの大規模な言語モデル(LLM)の実習に役立つサイトをスリップしないことを目的としたWebフックをブロックするユーザーの機能を提供します。

GPTBotと呼ばれるこれは、人工知能(AI)のより大きな能力を訓練し、強化するためにインターネットを梳くシステムです。

このツールを使用することで、既存のAIモデルをその側面、正確性、セキュリティ面で改善する可能性があります。

「GPTBotユーザーエージェントとクロールしたWebページは、将来のモデルを洗練するために使用され、ペイウォールアクセスが必要なソースを削除するためにフィルタリングされる可能性があります」とOpenAIは述べています。

「個人情報(PII)を収集するか、ポリシーに違反するテキストを持つことが知られています」と彼は付け加えました。

ただし、Webサイトは、Webデバイスへのアクセスを制限し、GPTBotが部分的に、または完全にオプトアウトしてそれにアクセスするのを防ぐことを選択できます。

「GPTBotがサイトにアクセスできるようにすることで、AIモデルがより正確になり、その機能とセキュリティ全般を向上させるのに役立ちます」とOpenAIは述べています。

OpenAIによると、Webサイトオペレーターは、IPアドレスをブロックしたり、基本的にアクセスできるものやアクセスできないものを指示するテキストファイルである Robot.txt を使用してサイトに追加したりすることで、翼を禁止できます。

オペレーターは、一部のページを許可したり、他のページを禁止したりすることで、Webデバイスが使用できる部分をカスタマイズすることもできます。

8月8日火曜日にThe Vergeを発売し、インターネットはOpenAIのGPTモデルやBardがGoogleを持っているなど、LLMに多くのトレーニングデータを提供することが知られています。

残念ながら、OpenAI自身は、ソーシャルメディアの投稿、著作権で作成された作品、またはインターネットのどの部分を削除して情報を取得したかを確認していません。