جاكرتا - إذا كنت غالبا ما تستخدم روبوتات الدردشة التي تعمل بالذكاء الاصطناعي (الذكاء الاصطناعي) ، سواء في شكل ويب أو تطبيق ، فيجب أن تدرك أن هذه التقنية غالبا ما توفر استجابة طويلة.
يتم تنظيم ذلك بالفعل من قبل نظام نموذج الذكاء الاصطناعي المستخدم. كلما كان نموذج الذكاء الاصطناعي أكثر تطورا ، كلما كانت الاستجابة أعطيت أكثر تفصيلا. في الواقع ، إذا أعطى روبوت الدردشة إجابة موجزة ، فقد يكون هذا مشكلة.
لا ينبغي للمستخدمين أيضا طلب إجابات موجزة من أجهزة الدردشة. وفقا لدراسة جديدة أجرتها Giskard ، وهي شركة اختبار الذكاء الاصطناعي من باريس ، سيكون لطلبات الإجابة الموجزة تأثير سلبي على قدرات الذكاء الاصطناعي التي يستخدمونها.
والأسوأ من ذلك، أن هذا سيسبب الهلوسة. كلما كان الدردشة أكثر تهيجما ، زادت الردود التي سيتم منحها. وهذا يعني أن أداء هذه التكنولوجيا قد انخفض.
"تظهر بياناتنا أن التغييرات البسيطة في تعليمات النظام تؤثر بشكل كبير على ميل النموذج إلى التخفيف" ، تابع الباحثون ، نقلا عن TechCrunch.
الهلوسة هي المشكلة الرئيسية لهذا النموذج لأنه من الصعب التغلب عليها. في الواقع ، لا يزال بإمكان النماذج المتقدمة التي صنعتها OpenAI و Meta الهلوسة على الرغم من أن الكثير من الناس استخدموا نظام الدردشة الخاص بهم.
عندما يخضع نموذج للتهوس ، فإن التكنولوجيا ستلخص القصة. استنادا إلى شرح باحث Giskard ، يمكن أن يربك الطلب على إجابات موجزة النظام لأنه غالبا ما يتعارض مع أسئله.
على سبيل المثال ، عندما يطلب المستخدمون تفسيرا لتاريخ الحرب العالمية الثانية ، يطلبون إجابة موجزة. هذان الأمران متناقضان للغاية لأن التاريخ عادة ما يتطلب تفسيرا طويلا جدا.
هناك العديد من نماذج الذكاء الاصطناعي التي تم اختبارها بواسطة Giskard بأوامر إجابة موجزة. بعض هذه النماذج هي GPT-4o من OpenAI ، وكلود 3.5 Sonnet من Anthropic ، و Deepsek V3 ، و Llama 4 من Meta ، إلى Grok 2. خضع طراز الذكاء الاصطناعي بأكمله لانخفاض في الدقة بعد أن طلب منه الإجابة بإيجاز.
The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)