JAKARTA - أصدرت DeepSeek نموذج الذكاء الاصطناعي "الموسطة" نحو الهندسة المعمارية من الجيل التالي

أنشرها:

جاكرتا - أصدرت شركة DeepSeek الصينية لمطوري الذكاء الاصطناعي أحدث طراز لها وهو "تجريبي". يزعم أن هذا النموذج أكثر كفاءة في التدريب وأفضل في معالجة التسلسلات النصية الطويلة من الموديلات السابقة.

أطلقت الشركة الناشئة التي تتخذ من هانغتشو مقرا لها اسم العرض DeepSeek-V3.2-Exp ، ووصفته بأنه "خطوة بين الهندسة المعمارية للجيل القادم" في منشور على منتدى مطوري Hugging Face.

من المرجح أن تكون الهندسة المعمارية الجديدة المعنية هي إطلاق أهم منتجات DeepSeek منذ طرازات V3 و R1 التي صدمت وادي السيليكون والمستثمرين في مجال التكنولوجيا خارج الصين.

تم تجهيز هذا النموذج V3.2-Exp بآلية تسمى DeepSeek Sparse Attention ، والتي تقول الشركة إنها يمكن أن تخفض تكاليف الحوسبة مع تحسين أداء النموذج من عدة جوانب. في منشور على النظام الأساسي X يوم الاثنين 29 سبتمبر ، أعلنت DeepSeek أيضا أنها ستخفض أسعار واجهات برمجة التطبيقات بأكثر من 50٪.

على الرغم من أنه من غير المتوقع أن تهز الهندسة المعمارية للجيل القادم من DeepSeek السوق كما كان من المتوقع في النسخة السابقة في يناير ، إلا أن نجاحه لا يزال بإمكانه فرض ضغط كبير على المنافسين المحليين مثل Qwen التابع لشركة علي بابا ، وكذلك اللاعبين الدوليين مثل OpenAI ، إذا تمكن DeepSeek مرة أخرى من إظهار أداء عالي بتكلفة أقل بكثير من منافسيه.

The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)

Tag: deepseek artificial intelligence kecerdasan buatan china