مايكروسوفت تطلق SkillOpt ، وكيل الذكاء الاصطناعي يمكنه التعلم دون إعادة تدريب النموذج

أنشرها:

جاكرتا - أطلقت مايكروسوفت SkillOpt، وهي إطار عمل مفتوح المصدر يمكنه تحسين قدرات وكلاء الذكاء الاصطناعي دون تغيير أوزان نماذجها الأساسية.

وكما ذكرت VentureBeat نقلا عن يوم الاثنين ، 15 يونيو ، تم تصميم SkillOpt لتحسين "المهارات" للوكلاء الذكاء الاصطناعي. وكلاء الذكاء الاصطناعي هي أنظمة الذكاء الاصطناعي التي يمكنها تنفيذ مهام معينة بشكل مستقل ، مثل كتابة التعليمات البرمجية أو قراءة المستندات أو استخدام الأدوات الرقمية.

المهارة المقصودة هي مجموعة من التعليمات في مستندات markdown (.md). يمكن أن تتكون من قواعد العمل ، تنسيق الإخراج ، كيفية استخدام الأداة ، إلى الخطوات لتجنب الأخطاء.

في الماضي ، تم تحسين مهارات وكلاء الذكاء الاصطناعي عادة يدويًا. يجب على المطورين تغيير التعليمات واحدة تلو الأخرى. العملية غالبا ما تكون مثل التخمين. أي جملة تجعل الذكاء الاصطناعي أكثر دقة ، أي جملة تقلل من الأداء.

تحاول SkillOpt جعل العملية أكثر قابلية للقياس. تعامل Microsoft مع مستندات المهارات كأشياء يمكن تدريبها. يقرأ النظام نتائج عمل وكيل الذكاء الاصطناعي ، ويجد أنماط الأخطاء ، ثم يقترح تغييرات على التعليمات.

لكن التغييرات لا يتم تطبيقها على الفور. يختبرها SkillOpt أولاً. إذا ارتفع الأداء ، يتم قبول التغيير. إذا انخفض ، يتم رفض التغيير وحفظه كمثال سيئ حتى لا يتم تكراره.

وقال ييفان يانغ، كبير الباحثين في SDE في معهد مايكروسوفت للأبحاث الآسيوية، إن المشكلة الرئيسية ليست مجرد تغيير المهارات، ولكن التأكد من أن التغيير يحسن الأداء حقا.

"المشكلة ليست في ما إذا كان الفريق يمكنه تغيير المهارة ، ولكنهم لا يستطيعون ضمان أن التغيير هو تحسين" ، قال يانغ لفيجنر بييت.

ووفقا لما قال، هناك ثلاثة مصادر للمشكلة. يمكن أن تكون التغييرات بعيدة للغاية، أو غير موثقة، أو أن الأخطاء القديمة تستمر في العودة لأن النظام ليس لديه "ذاكرة سلبية".

وأعطى مثال على أن تغيير التعليمات التي لم يتم اختبارها قد خفضت درجة GPT-5.5 في SpreadsheetBench من 41.8 إلى 41.1.

يستخدم SkillOpt مبدأ مماثل للتعلم العميق أو التعلم العميق. هناك حدود على عدد التغييرات، واختبار التحقق، وآلية للحفاظ على التعلم الذي ثبت أنه مفيد. الاختلاف هو أن SkillOpt لا يمس أوزان نماذج الذكاء الاصطناعي. هي أوزان النموذج هي المعلمات الأساسية التي تحدد كيفية عمل نموذج الذكاء الاصطناعي.

في الاختبارات التي نقلتها VentureBeat ، جربت Microsoft SkillOpt على نماذج مختلفة ، من GPT-5.5 إلى GPT-5.4-mini و Qwen3.5-4B. وتشمل اختباراتها الأسئلة والأجوبة ، وصياغة التعليمات البرمجية باستخدام أدوات ، والتفكير في الوثائق المتعددة الوسائط ، أي الوثائق التي تجمع بين النصوص والصور.

ونتيجة لذلك ، حسنت SkillOpt الأداء في جميع 52 مزيج من النماذج والمقاييس وبيئات العمل التي تم اختبارها. مقياس هو اختبار قياسي لقياس قدرة نموذج الذكاء الاصطناعي. في GPT-5.5 ، وصل متوسط التحسن إلى 23.5 نقطة مقارنة بحالة بدون مهارة.

تستفيد النماذج الصغيرة أيضا من ذلك. GPT-5.4-nano يكاد أن يضاعف النتيجة في الاستفسار عن الوثائق المتعددة الوسائط ويضاعف الأداء في مهمة اتخاذ القرارات المتتالية.

بالنسبة للشركات ، هذه التكنولوجيا جذابة لأن الكثير من أعمال الذكاء الاصطناعي لا تزال عرضة للخطأ في الأمور المهمة: أخذ الأرقام من العقود والفواتير والنماذج ؛ الحفاظ على التنسيق ؛ استخدام الأداة بشكل صحيح ؛ وإنتاج نتائج قابلة للمراجعة.

وقال إن هذا التحسن ليس لأن الذكاء الاصطناعي يتذكر الإجابات. يصبح النظام أفضل لأنه يتعلم إجراءات العمل.

يمكن أيضًا نقل SkillOpt بين البيئات. يمكن استخدام جدول بيانات المهارة المدرب على Codex CLI ، على سبيل المثال ، في Claude Code وتوفير زيادة قدرها 59.7 نقطة مقارنة بالقدرات المدمجة في Claude Code.

بالنسبة للأعمال التجارية ، توفر SkillOpt طريقة لجعل الوكلاء الآليين أكثر انضباطا وتناسقا وسهولة التدقيق دون إعادة تدريب النماذج الأساسية التي تكون عادة مكلفة ومعقدة.

The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)

Tag: microsoft teknologi artificial intelligence