Microsoft crée SkillOpt, un agent IA qui peut apprendre sans retraiter un modèle

JAKARTA - Microsoft a introduit SkillOpt, un framework open source qui peut améliorer les capacités d'agents IA sans modifier les poids de leur modèle de base.

Comme l’a rapporté VentureBeat cit́é lundi 15 juin, SkillOpt est désigné pour réparer les « comptes » des agents IA. Les agents IA sont des systèmes d’intelligence artificielle capables d’exécuter des tâches détermines de manière autonome, par exemple, écrire du code, lire des documents ou utiliser des outils numériques.

Les compétences concernent un ensemble d'instructions dans un document markdown (.md). Le contenu peut prendre la forme d'une règle de travail, d'un format de sortie, d'une façon de s'en servir, jusqu'à une étape pour éviter les erreurs.

Jusqu'à présent, les compétences des agents IA étaient généralement améliorées manuellement. Les développeurs devaient modifier les instructions un par un. Le processus ressemblait souvent à un devin. Quelles sont les phrases qui rendent l'IA plus précise, lesquelles réduisent la performance.

SkillOpt tente de rendre le processus plus mesurable. Microsoft traite les documents de compétences comme des objets pouvant être entraînés. Le système lit les résultats du travail d'agents IA, trouve des schémas d'erreurs, puis propose des modifications aux instructions.

Mais les changements ne sont pas appliqués immédiatement. SkillOpt les teste d'abord. Si la performance augmente, le changement est accepté. Si elle diminue, le changement est rejeté et conservé comme exemple négatif afin qu'il ne soit pas répété.

Yifan Yang, chercheur principal en SDE à Microsoft Research Asia, a dit que le principal problème n’est pas seulement de changer les compétences, mais de s’assurer que le changement améliore vraiment les performances.

« Le problème n’est pas de savoir si l’équipe peut changer les compétences, mais qu’ils ne peuvent pas garantir que le changement est une amélioration », a dit Yang à VentureBeat.

Selon Yang, il y a trois sources de problèmes. Les changements peuvent être trop éloignés, non validés ou les erreurs anciennes continuent à revenir car le système n’a pas de «́mémoire négativé».

Il a également évoqué le changement d’instructions qui n’a pas été testté et a réduit le score GPT-5.5 sur SpreadsheetBench de 41,8 à 41,1.

SkillOpt utilise un principe similaire à l'apprentissage profond ou au deep learning. Il y a une limite au nombre de changements, d'essais de validation et de mécanismes pour maintenir l'apprentissage qui s'est avéré utile. La différence est que SkillOpt ne touche pas les poids du modèle AI. Les poids du modèle sont les paramètres fondamentaux qui déterminent la façon dont le modèle AI fonctionne.

Dans les tests cités par VentureBeat, Microsoft a essayé SkillOpt sur de nombreux modèles, du GPT-5.5 au GPT-5.4-mini et au Qwen3.5-4B. Ses essais incluent des questions-réponses, la création de code avec des outils et l’inferencing de documents multimodaux, c’est-à-dire des documents qui combinent texte et images.

En conséquence, SkillOpt a amélioré les performances sur les 52 combinaisons de modèles, de repères et d'environnements de travail testés. Les repères sont des tests standard pour mesurer les capacités des modèles d'IA. Sur GPT-5.5, l'augmentation moyenne atteint 23,5 points par rapport à l'état sans compétence.

Les petits modèles en bénéficient également. GPT-5.4-nano a presque doublé le score dans le test de question-réponse sur des documents multimodaux et a multiplié par deux la performance dans la tâche de prise de décision séquentielle.

Pour les entreprises, cette technologie est intéressante car de nombreux emplois d'IA sont encore sujets à des erreurs sur des points importants: prendre des chiffres de contrats, de factures et de formulaires; garder le format; utiliser les outils correctement; et produire des résultats vérifiables.

Ce qui signifie que l'amélioration n'est pas due au fait que l'IA mémorise les réponses. Le système devient meilleur en apprenant les procédures de travail.

SkillOpt peut également être transféré entre environnements. Un tableau de compétences formé sur le Codex CLI, par exemple, peut être utilisé dans Claude Code et produire une augmentation de 59,7 points par rapport aux capacités intégrées de Claude Code.

Pour le monde des affaires, SkillOpt propose un moyen de rendre les agents IA plus disciplinés, cohérents et faciles à auditer sans retrainer les modèles de base, qui sont généralement coûteux et complexes.

The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)

Tag: microsoft teknologi artificial intelligence

Add VOI as a Preferred Source

Follow VOI news updates across Google.

Tags les plus populaires

#Prabowo Subianto #Donald Trump #13232 #4500 #8791

Populaire

| LA TECHNOLOGIE

Connaître les avantages de l'Internet des objets (IoT) à l'ère numérique actuelle

30 Juli 2026, 04:49

Are you 18 years or older?

Microsoft crée SkillOpt, un agent IA qui peut apprendre sans retraiter un modèle

Tags les plus populaires

Populaire

Connaître les avantages de l'Internet des objets (IoT) à l'ère numérique actuelle

Nouvelles connexes

Le gouvernement vise à achever la réorganisation des bénéficiaires de MBG avant le 5 août

Comprendre la division des zones de rythme cardiaque lors de la course pour un entraînement plus optimal

Myanmar accepte de rapatrier 5 000 Rohingyas réfugiés de Malaisie

BTS n'a pas inscrit ses œuvres au Grammy, la catégorie Pop asiatique est mise en doute

7 avantages de l'entraînement par intervalles (HIIT) pour la santé et la condition physique du corps

Comment commencer l'habileté de courir pour les débutants en toute sécurité