Partager:

JAKARTA - Microsoft a introduit SkillOpt, un framework open source qui peut améliorer les capacités d'agents IA sans modifier les poids de leur modèle de base.

Comme l’a rapporté VentureBeat cit́é lundi 15 juin, SkillOpt est désigné pour réparer les « comptes » des agents IA. Les agents IA sont des systèmes d’intelligence artificielle capables d’exécuter des tâches détermines de manière autonome, par exemple, écrire du code, lire des documents ou utiliser des outils numériques.

Les compétences concernent un ensemble d'instructions dans un document markdown (.md). Le contenu peut prendre la forme d'une règle de travail, d'un format de sortie, d'une façon de s'en servir, jusqu'à une étape pour éviter les erreurs.

Jusqu'à présent, les compétences des agents IA étaient généralement améliorées manuellement. Les développeurs devaient modifier les instructions un par un. Le processus ressemblait souvent à un devin. Quelles sont les phrases qui rendent l'IA plus précise, lesquelles réduisent la performance.

SkillOpt tente de rendre le processus plus mesurable. Microsoft traite les documents de compétences comme des objets pouvant être entraînés. Le système lit les résultats du travail d'agents IA, trouve des schémas d'erreurs, puis propose des modifications aux instructions.

Mais les changements ne sont pas appliqués immédiatement. SkillOpt les teste d'abord. Si la performance augmente, le changement est accepté. Si elle diminue, le changement est rejeté et conservé comme exemple négatif afin qu'il ne soit pas répété.

Yifan Yang, chercheur principal en SDE à Microsoft Research Asia, a dit que le principal problème n’est pas seulement de changer les compétences, mais de s’assurer que le changement améliore vraiment les performances.

« Le problème n’est pas de savoir si l’équipe peut changer les compétences, mais qu’ils ne peuvent pas garantir que le changement est une amélioration », a dit Yang à VentureBeat.

Selon Yang, il y a trois sources de problèmes. Les changements peuvent être trop éloignés, non validés ou les erreurs anciennes continuent à revenir car le système n’a pas de «́mémoire négativé».

Il a également évoqué le changement d’instructions qui n’a pas été testté et a réduit le score GPT-5.5 sur SpreadsheetBench de 41,8 à 41,1.

SkillOpt utilise un principe similaire à l'apprentissage profond ou au deep learning. Il y a une limite au nombre de changements, d'essais de validation et de mécanismes pour maintenir l'apprentissage qui s'est avéré utile. La différence est que SkillOpt ne touche pas les poids du modèle AI. Les poids du modèle sont les paramètres fondamentaux qui déterminent la façon dont le modèle AI fonctionne.

Dans les tests cités par VentureBeat, Microsoft a essayé SkillOpt sur de nombreux modèles, du GPT-5.5 au GPT-5.4-mini et au Qwen3.5-4B. Ses essais incluent des questions-réponses, la création de code avec des outils et l’inferencing de documents multimodaux, c’est-à-dire des documents qui combinent texte et images.

En conséquence, SkillOpt a amélioré les performances sur les 52 combinaisons de modèles, de repères et d'environnements de travail testés. Les repères sont des tests standard pour mesurer les capacités des modèles d'IA. Sur GPT-5.5, l'augmentation moyenne atteint 23,5 points par rapport à l'état sans compétence.

Les petits modèles en bénéficient également. GPT-5.4-nano a presque doublé le score dans le test de question-réponse sur des documents multimodaux et a multiplié par deux la performance dans la tâche de prise de décision séquentielle.

Pour les entreprises, cette technologie est intéressante car de nombreux emplois d'IA sont encore sujets à des erreurs sur des points importants: prendre des chiffres de contrats, de factures et de formulaires; garder le format; utiliser les outils correctement; et produire des résultats vérifiables.

Ce qui signifie que l'amélioration n'est pas due au fait que l'IA mémorise les réponses. Le système devient meilleur en apprenant les procédures de travail.

SkillOpt peut également être transféré entre environnements. Un tableau de compétences formé sur le Codex CLI, par exemple, peut être utilisé dans Claude Code et produire une augmentation de 59,7 points par rapport aux capacités intégrées de Claude Code.

Pour le monde des affaires, SkillOpt propose un moyen de rendre les agents IA plus disciplinés, cohérents et faciles à auditer sans retrainer les modèles de base, qui sont généralement coûteux et complexes.


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)

Add VOI as a Preferred Source
Follow VOI news updates across Google.
+