JAKARTA - أصدرت DeepSeek نموذج الذكاء الاصطناعي "الموسطة" نحو الهندسة المعمارية من الجيل التالي

جاكرتا - أصدرت شركة DeepSeek الصينية لمطوري الذكاء الاصطناعي أحدث طراز لها وهو "تجريبي". يزعم أن هذا النموذج أكثر كفاءة في التدريب وأفضل في معالجة التسلسلات النصية الطويلة من الموديلات السابقة.

أطلقت الشركة الناشئة التي تتخذ من هانغتشو مقرا لها اسم العرض DeepSeek-V3.2-Exp ، ووصفته بأنه "خطوة بين الهندسة المعمارية للجيل القادم" في منشور على منتدى مطوري Hugging Face.

من المرجح أن تكون الهندسة المعمارية الجديدة المعنية هي إطلاق أهم منتجات DeepSeek منذ طرازات V3 و R1 التي صدمت وادي السيليكون والمستثمرين في مجال التكنولوجيا خارج الصين.

تم تجهيز هذا النموذج V3.2-Exp بآلية تسمى DeepSeek Sparse Attention ، والتي تقول الشركة إنها يمكن أن تخفض تكاليف الحوسبة مع تحسين أداء النموذج من عدة جوانب. في منشور على النظام الأساسي X يوم الاثنين 29 سبتمبر ، أعلنت DeepSeek أيضا أنها ستخفض أسعار واجهات برمجة التطبيقات بأكثر من 50٪.

على الرغم من أنه من غير المتوقع أن تهز الهندسة المعمارية للجيل القادم من DeepSeek السوق كما كان من المتوقع في النسخة السابقة في يناير ، إلا أن نجاحه لا يزال بإمكانه فرض ضغط كبير على المنافسين المحليين مثل Qwen التابع لشركة علي بابا ، وكذلك اللاعبين الدوليين مثل OpenAI ، إذا تمكن DeepSeek مرة أخرى من إظهار أداء عالي بتكلفة أقل بكثير من منافسيه.