Microsoft SkillOpt बनाता है, एआई एजेंट मॉडल को फिर से प्रशिक्षित किए बिना सीख सकता है

साझा करें:

JAKARTA - Microsoft ने SkillOpt पेश किया, एक ओपन सोर्स फ्रेमवर्क जो मूल मॉडल के वजन को बदलने के बिना एआई एजेंट की क्षमता में सुधार कर सकता है।

जैसा कि वेंचरबीट ने सोमवार, 15 जून को रिपोर्ट किया, स्किलऑप्ट एआई एजेंटों के "कौशल" को सुधारने के लिए डिज़ाइन किया गया है। एआई एजेंट एक कृत्रिम बुद्धिमत्ता प्रणाली है जो स्वतंत्र रूप से एक निश्चित कार्य चला सकती है, जैसे कोड लिखना, दस्तावेज़ पढ़ना या डिजिटल उपकरण का उपयोग करना।

उल्लेख किया गया कौशल एक markdown दस्तावेज़ (.md) में निर्देशों का एक संग्रह है। इसमें काम करने के नियम, आउटपुट प्रारूप, उपकरण का उपयोग करने का तरीका, गलतियों से बचने के लिए कदम शामिल हो सकते हैं।

इस समय तक, एआई एजेंट के कौशल को आमतौर पर मैनुअल रूप से सुधारा जाता है। डेवलपर्स को निर्देशों को एक-एक करके बदलना होगा। प्रक्रिया अक्सर अनुमान लगाने जैसी होती है। एआई को और अधिक सटीक बनाने वाली कौन सी वाक्य है, कौन सी वास्तव में प्रदर्शन को कम करती है।

SkillOpt उस प्रक्रिया को अधिक मापनीय बनाने का प्रयास करता है। Microsoft एआई एजेंट के काम के परिणामों को पढ़ता है, गलतियों के पैटर्न को खोजता है, और फिर निर्देशों में बदलाव का प्रस्ताव करता है।

लेकिन परिवर्तन तुरंत लागू नहीं किए जाते हैं। SkillOpt पहले इसे परीक्षण करता है। यदि प्रदर्शन बढ़ता है, तो परिवर्तन स्वीकार किया जाता है। यदि यह गिरता है, तो परिवर्तन अस्वीकार कर दिया जाता है और एक बुरा उदाहरण के रूप में संग्रहीत किया जाता है ताकि इसे दोहराया न जाए।

Microsoft Research Asia में एक वरिष्ठ अनुसंधान SDE, याफ़न यांग ने कहा कि मुख्य समस्या केवल कौशल को बदलना नहीं है, बल्कि यह सुनिश्चित करना है कि परिवर्तन वास्तव में प्रदर्शन में सुधार करता है।

"समस्या यह नहीं है कि टीम कौशल को बदल सकती है, लेकिन वे यह सुनिश्चित नहीं कर सकते कि परिवर्तन सुधार है," यांग ने वेंचरबीट को बताया।

यांग के अनुसार, समस्या के तीन स्रोत हैं। परिवर्तन बहुत दूर हो सकता है, मान्य नहीं हो सकता है, या पुराने दोष वापस आ सकते हैं क्योंकि सिस्टम में "नकारात्मक स्मृति" नहीं है।

उन्होंने उदाहरण दिया, परीक्षण किए बिना निर्देशों में बदलाव ने स्प्रेडशीटबेंच पर GPT-5.5 स्कोर को 41.8 से 41.1 तक कम कर दिया।

SkillOpt एक समान सिद्धांत का उपयोग करता है, जो गहन शिक्षण या गहन शिक्षण है। परिवर्तन की संख्या, सत्यापन परीक्षण और सिद्ध शिक्षण को बनाए रखने के लिए एक तंत्र है। अंतर यह है कि SkillOpt एआई मॉडल के वजन को नहीं छूता है। मॉडल वजन एआई मॉडल के काम करने के तरीके को निर्धारित करने वाले मुख्य पैरामीटर हैं।

वेंचरबीट द्वारा उद्धृत परीक्षण में, माइक्रोसॉफ्ट ने GPT-5.5 से GPT-5.4-मिनी और Qwen3.5-4B तक विभिन्न मॉडलों पर स्किलऑप्ट का प्रयास किया। उनके परीक्षण में प्रश्नोत्तर, उपकरण के साथ कोड बनाने और बहुआयामी दस्तावेज़ों पर विचार शामिल है, जो टेक्स्ट और चित्रों को जोड़ने वाले दस्तावेज़ हैं।

नतीजतन, SkillOpt ने परीक्षण किए गए सभी 52 मॉडल संयोजनों, मीट्रिक और कार्य वातावरण पर प्रदर्शन में सुधार किया। मीट्रिक एआई मॉडल की क्षमता को मापने के लिए एक मानक परीक्षण है। GPT-5.5 पर, औसत वृद्धि 23.5 अंकों तक पहुंच गई, जबकि कौशल के बिना स्थिति थी।

छोटे मॉडल को भी बड़ा लाभ मिला। GPT-5.4-nano मल्टीमीडिया दस्तावेज़ प्रश्नोत्तरी पर स्कोर लगभग दोगुना कर देता है और अनुक्रमिक निर्णय लेने के कार्य पर प्रदर्शन को दोगुना कर देता है।

कंपनियों के लिए, यह तकनीक दिलचस्प है क्योंकि एआई की कई नौकरियां अभी भी महत्वपूर्ण बातों पर गलत होने के लिए संवेदनशील हैं: अनुबंध, चालान और फॉर्म से संख्या लेना; प्रारूप बनाए रखना; उपकरण का सही तरीके से उपयोग करना; और एक ऑडिट योग्य उत्पादन उत्पन्न करना।

जो कहता है कि वृद्धि एआई द्वारा जवाब याद रखने के कारण नहीं है। प्रणाली काम करने की प्रक्रिया को सीखने के कारण बेहतर हो जाती है।

SkillOpt को वातावरण के बीच भी स्थानांतरित किया जा सकता है। एक स्प्रेडशीट कौशल जिसे कोडेक्स CLI में प्रशिक्षित किया गया था, उदाहरण के लिए, कोड के कोड में इस्तेमाल किया जा सकता है और कोड के कोड के साथ-साथ क्षमता की तुलना में 59.7 अंक की वृद्धि पैदा करता है।

व्यवसायों के लिए, SkillOpt एक एआई एजेंट को अधिक अनुशासित, सुसंगत और आसानी से लेखा परीक्षित करने का तरीका प्रदान करता है, बिना किसी मूल मॉडल को फिर से प्रशिक्षित किए, जो आमतौर पर महंगा और जटिल होता है।

The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)

Tag: microsoft teknologi artificial intelligence