Meta lance un modèle d’IA pouvant évaluer d’autres travaux d’IA
JAKARTA – Meta, la société mère de Facebook, a annoncé la sortie d’un certain nombre de derniers modèles d’intelligence artificielle (IA) de sa division de recherche le vendredi 18 octobre, y compris un modèle nommé « self-taught Evaluator ». Ce modèle offre le potentiel de réduire l’implication humaine dans le processus de développement de l’IA.
L’annonce suivait l’introduction de l’outil dans un document publié par Meta en août, expliquant comment ce modèle utilise une technique de « chaîne de réflexion », similaire à celle utilisée dans les récents modèles OpenAI, pour faire une évaluation plus fiable des résultats d’autres modèles d’IA. Cette technique résout les problèmes complexes en des mesures loghiques plus petites, augmentant la précision des réponses dans des domaines tels que la science, la logisation et les mathématiques.
Fait intéressant, ce modèle d’évaluateurs est formé à l’aide pleinement des données générées par l’IA, sans toute implication humaine pendant le processus de formation.
Les deux chercheurs Meta derrière le projet disent que la capacité d’IA d’évaluer de manière fiable le travail d’autresIA ouvre la possibilité de créer des agents AI autonomes qui peuvent apprendre de leurs propres défauts. De tels agents sont considérés par de nombreuses parties de l’industrie de l’IA comme des assistants numériques intelligents capables de résoudre diverses tâches sans ingérence humaine.
« J’espère que, avec le développement de l’IA qui devient de plus en plus « super-humain », l’IA sera meilleure dans l’examen de son propre travail, encore meilleure que la moyenne humaine », a déclaré Jason Weston, un des chercheurs en méta.
Les modèles d’IA qui peuvent s’améliorer eux-mêmes peuvent également remplacer des processus coûteux et inefficaces tels que l’apprentissage en renforcement grâce au feedback humain, qui nécessite actuellement une contribution d’un notateur humain qui dispose d’expertise spéciale.
En plus de Meta, d’autres entreprises telles que Google et Anthropic ont également publié des recherches liées au concept de RLAIF (apprentissage en renforçant par l’IA Feedback), mais Meta est plus ouvert en publiant ses modèles pour une utilisation par le public.
En plus du « self-taught Evaluator », Meta a également publié vendredi plusieurs autres outils d’IA, y compris une mise à jour pour le modèle d’identification d’image « segment tout », un outil qui accélère le temps d’interaction pour les modèles de grande langue (LLM) et un ensemble de données qui peut aider à la découverte de nouveaux matériaux inorganiques.