Les chercheurs du MIT introduisent une méthode de formation efficace pour des AI Agents fiables
Les chercheurs du MIT ont développé un algorithme innovant pour améliorer la formation des agents d’intelligence artificielle (IA), les rendant plus fiables dans la gestion de tâches complexes impliquant des variations. Cette avancée a des implications majeures dans des domaines tels que la robotique, la médecine et la science politique, où les agents d’IA doivent prendre des décisions critiques. Par exemple, un AI Agent gérant le trafic urbain pourrait optimiser les temps de trajet tout en améliorant la sécurité et la durabilité.
Défis dans la formation des agents d’IA
Former des agents d’IA à prendre des décisions efficaces dans des scénarios variés est un processus complexe. Les modèles d’apprentissage par renforcement, qui alimentent de nombreux systèmes décisionnels, échouent souvent face à de légères variations dans les conditions des tâches. Par exemple, un agent d’IA chargé de gérer le trafic pourrait avoir du mal à s’adapter à des intersections avec des limitations de vitesse, des configurations de voies ou des schémas de trafic différents.
Pour relever ces défis, les chercheurs du MIT ont développé un algorithme qui sélectionne stratégiquement des tâches clés, garantissant que l’agent d’IA est formé efficacement pour exceller dans une gamme de tâches connexes.
Une sélection de tâches plus intelligente pour les agents d’IA
La nouvelle méthode s’appuie sur Model-Based Transfer Learning (MBTL) pour optimiser la formation. Au lieu de former les agents d’IA sur toutes les tâches d’un ensemble de données, l’algorithme se concentre sur celles qui apportent le plus de valeur à la performance globale. Dans un scénario de contrôle du trafic, cela implique de sélectionner les intersections qui fournissent les informations les plus utiles pour le réseau entier.
Le MBTL combine une formation spécifique à certaines tâches avec l’apprentissage par transfert—une technique où un agent d’IA formé sur une tâche peut effectuer efficacement des tâches connexes sans nécessiter d’ajustements supplémentaires. L’algorithme modélise explicitement la capacité de généralisation d’un agent d’IA, permettant ainsi de prioriser les tâches qui maximisent les améliorations de performance.
Une efficacité sans précédent
Les tests ont révélé que le MBTL améliore l’efficacité de la formation de cinq à 50 fois par rapport aux méthodes traditionnelles. Par exemple, alors que les approches standards pourraient nécessiter une formation sur 100 tâches, le MBTL peut atteindre une performance équivalente ou supérieure en ne formant que sur deux tâches.
« Les données des 98 autres tâches n’étaient soit pas nécessaires, soit perturbaient même les performances, rendant l’agent d’IA confus », explique Cathy Wu, auteure principale de l’étude et professeure associée au MIT.
Applications futures
Les chercheurs prévoient d’étendre le MBTL à des problèmes plus complexes, notamment ceux comportant des espaces de tâches à haute dimension. Ils souhaitent également appliquer leur approche à des scénarios réels, comme les systèmes de mobilité de nouvelle génération, où les agents d’IA pourraient jouer un rôle transformateur.
Soutenue par la Fondation nationale pour la science, la Fondation éducative Kwanjeong et Amazon Robotics, cette recherche sera présentée à la conférence sur les systèmes de traitement de l’information neuronale.
Cette avancée améliore non seulement le processus de formation, mais positionne également les agents d’IA comme des outils plus adaptables et fiables pour relever les défis du monde réel.