Antropic pourrait arrêter les discussions dangereuses
AKARTA - Anthropic a lancé une nouvelle capacité pour Cloud Opus 4 et 4.1. Le modèle d’intelligence artificielle (IA) peut désormais mettre fin à une conversation qui conduit à un contenu nuisible ou abusif.
rénal. La société dit que les interactions qui conduisent à des cas extrêmes sont rares, mais cela doit toujours être évité. En tant qu’une forme de protection supplémentaire pour ses utilisateurs, Anthropic a délibérément développé cette fonctionnalité.
al Al Asmar sur le blogueur : “Nous sommes toujours très peu sûrs du statut moral potentiel des gens et d’autres droits de l’homme, à l’heure actuelle ou à l’avenir.”
« Cependant, nous prenons cette question au sérieux », a déclaré anthropic dans un communiqué, cité lundi 18 août 2025.
anthropic dit que cette nouvelle fonctionnalité a été développée à faibles coûts. Le dernier modèle naud peut interférer avec la conversation en résiliant ou en se retirant de l’interaction si le système identifie le potentiel dangereux.
Opus 4, le modèle d’IA a montré une forte dissuasion du contenu dangereux. Par exemple, le modèle d’IA cessera de répondre à des demandes inappropriées qui conduisent à des contenus sexuels d’enfants ou à des plans de terreur.
décidant de mettre fin à la conversation, l’utilisateur ne sera pas en mesure d’envoyer le message. Cependant, cela n’affecte pas d’autres conversations sur leur compte. Les utilisateurs peuvent encore commencer une nouvelle conversation.
Pour surmonter la perte potentielle de conversations importantes, les utilisateurs peuvent essayer de repasser le message précédent. Cette manœuvre est donnée pour que les utilisateurs puissent continuer les discussions critiques qui ne sont pas dangereuses.