アンスロピックのAIクルーズモデルは危険な会話を止めることができます

ジャカルタ - アントロピックはクロードオプス4と4.1の新しい機能を開始します。人工知能(AI)モデルは、有害または虐待的なコンテンツにつながる会話を終わらせることができるようになりました。

同社は、極端な症例につながる相互作用はまれであるが、これはまだ避ける必要があると述べている。ユーザーのための高度な保護の一形態として、Anthropicは意図的にこの機能を開発しました。

「クロードや他のLLMの道徳的地位が、現在も将来も潜在的になる可能性について、私たちはまだ非常に確信が持てません。

「しかし、私たちはこの問題を真剣に受け止めています」と、アンソロピックは2025年8月18日月曜日に引用された声明で説明しました。

Anthropicによると、この新機能は低コストで開発されたという。クロードの最新のモデルは、システムが有害な可能性を識別した場合、相互作用を終了または終了することによって会話に介入することができます。

クロードオプス4の試験用試験中、AIモデルは有害なコンテンツに対する強い消極性を示しました。たとえば、AIモデルは、子供の性的コンテンツやテロ計画につながる不適切な要求への対応を停止します。

クロードが会話を終了することを決定した場合、ユーザーはメッセージを返信できません。ただし、これは彼らのアカウント上の他の会話には影響しません。ユーザーはまだ新しいチャットを開始できます。

重要な会話の潜在的な損失に対処するために、ユーザーは以前のメッセージを再試行することができます。この余裕は、ユーザーが無害な重要な議論を続けることができるように与えられます。

The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)

Tag: claude ai anthropic kecerdasan buatan artificial intelligence

Add VOI as a Preferred Source

Follow VOI news updates across Google.

最も人気のあるタグ

#Prabowo Subianto #ドナルド・トランプ #2026 World Cup #venezuela #konflik timur tengah

アンスロピックのAIクルーズモデルは危険な会話を止めることができます

最も人気のあるタグ

人気

クロードコードの秘密トラッカーが解読され、人間的言語がコードを削除

iPhone 17 Pro Maxはタイムカプセルに入り、2276年に古物になる可能性があります

Wamenkomdigi Nezar:国家コンピューティングクラスターはインドネシアのAI競争力の鍵です

5GとAIが中国の製造業を変革　工場の高速化と省エネ化が進展

Are you 18 years or older?

アンスロピックのAIクルーズモデルは危険な会話を止めることができます

最も人気のあるタグ

人気

関連