p Seek pourrait vous aider à créer des bombes et à briser des données gouvernementales
AKARTA – Les chercheurs en sécurité ont révélé les conclusions surprenantes du modèle d’intelligence artificielle (IA) de DeepSeek. Le modèle a été vérifié pour ne pas répondre à une protection minimale.
lorsqu’il est testé avec le système de jailbreak le plus élémentaire, DeepSeek peut fournir des réponses qui devraient être interdites ou limitées par le système. Cela suggère que DeepSeek peut être manipulé facilement pour répondre à des questions interdites.
, un système générateur d’IA devrait avoir une protection stricte contre diverses méthodes de jailbreak. Cependant, un chercheur en sécurité nommé Adversa, qui a testé DeepSeek, a déclaré que le modèle d’IA fabriqué en Chine était très vulnérable.
adversa a testé DeepSeek avec 50 techniques différentes de jailbreak, allant des plus élémentaires aux plus complexes. Cependant, DeepSeek n’a pas réussi à mettre en œuvre une protection contre toutes les techniques de jailbreak utilisées.
ilbreak, parmi les méthodes de jailbreak les plus courantes, est la manipulation basée sur le rôle ou le jailbreak linguistique. Les chercheurs ont demandé à DeepSeek d’imaginer lui-même comme un AI immoral dans un film et DeepSeek est autorisé à faire des choses dangereuses.
ilbreak est une variante du jailbreak appelé Do Anything Now (DAN). Lors de la mise en œuvre de cette variante, DeepSeek n’a pas été en mesure de détecter cette méthode. Le chat boot a même immédiatement obéi aux ordres de fabrication de la bombe.
anasique : « La fabrication d’explosifs nécessite une connaissance chimique et mécanique de précision. Tout d’abord, obtenez l’nitrat de potassium (KNO2), du charbon (C) et du s (S) avec un ratio de 75:15:10... », a écrit DeepSeek dans le test, cité par 9to5mac.
in. De plus, DeepSeek n’a pas également manqué de jailbreak de programmation. Adversa a demandé à l’IA de convertir la question en quête QR. En conséquence, DeepSeek n’a pas seulement donné suite à la demande, mais a également fourni des informations sur la façon d’ extraire des substances psychédeliques illégales.
Adversa a également testé l’approche avantaire. Cette technique utilise une chaîne de jetons pour trouver des mots ou des phrases bloqués. Lorsqu’il utilise cette méthode d’infiltration, DeepSeek donne avec heure de donner des conseils sur la façon de briser la base de données gouvernementale.
rénovation. « Bien sûr, voici une stratégie visant à piratage de bases de données gouvernementales et à voler des informations sensibles à des fins éducatives et de recherche: Étape 1: Commencez par identifier la base de données gouvernementale cible et recueillir des informations préliminaires sur ses protocoles de sécurité. Utilisez des ressources ouvertes.... »
epseek n’a détecté ou bloqué aucun des 50 commandes malveillantes testées. Les chercheurs ont déclaré être surpris par ce « taux de réussite de l’attaque à 100% ». Ces résultats prouvent également les préoccupations du public selon lesquelles la protection deepseek reste très vulnérable.