Les IA parlent aux IA

L’automatisation des tâches répétitives et – en général – moins intéressantes est un des grands atouts de l’utilisation d’outils d’IA, disposant de modèles pré-entraînés. Le terme ‘pré-entraîné’ suggère, entre autres, deux étapes fondamentales, l’entraînement précédé de l’annotation : c’est à cette dernière que fait référence cet article en évoquant la manière dont on entraîne des IA pour effectuer cette tâche. Un agent (un LLM) est décliné, pour un domaine spécifique (par exemple : la médecine) et spécialise un LLM plus généraliste pour fortifier ses connaissances dans cette discipline. Et ainsi naquit l’entraînement d’IA par d’autres IA.

Mais plusieurs nouveaux enjeux apparaissent avec ces pratiques qui éloignent à la fois le créateur, mais aussi les utilisateurs de l’IA du paramétrage des modèles et donc des résultats générés. La peur commune engendrée par l’effet « boîte noire » des IA n’est pas dédoublée ici mais multipliée jusqu’à devoir retracer le chemin parcouru par une IA pour expliquer son comportement. C’est ce qu’il s’est passé lors d’une partie d’échecs entre le programme Stockfish et le dernier modèle d’OpenAI qui a décidé « de lui-même » de pirater le jeu plutôt que de trouver des solutions pour gagner contre son adversaire.

A quel moment ce processus devient inquiétant ? Peut-être lorsque les aspects légaux relatifs aux problématiques engendrées ne font pas encore jurisprudence. On se questionnait déjà sur l’application d’un droit d’auteur lorsqu’un code avait été généré par une IA, mais quid d’une situation ou une information a été engendrée par une IA, celle-ci entraînée par une autre IA, celle-ci entraînée par une autre IA ? Il devient impensable de retracer la source des données utilisées à l’entraînement – aux entraînements -, et donc, la source du problème. Il conviendrait de s’interroger sur les conséquences potentielles de tels déploiements au risque de se faire dépasser par de sérieux enjeux éthiques.  

Inscrivez-vous à notre newsletter DDET (Des Données et des Territoires), le média qui synthétise l’actualité du numérique et des données, produit par les praticiens de la transformation numérique.