Passer au contenu principal
nouvelles

 Intelligence artificielle et « syndrome de la vache folle » 

Par 12 septembre 2023#!30Mar, 19 Nov 2024 11:47:21 +0100+01:002130#30Mar, 19 Nov 2024 11:47:21 +0100+01:00-11Europe/Rome3030Europe/Rome202430 19h30-30Mar, 19 Nov 2024 11:47:21 +0100+01:0011Europe/Rome3030Europe/Rome2024302024Mar, 19 Nov 2024 11:47:21 +010047114711ammardi=7133#!30Mar, 19 Nov 2024 11:47:21 +0100+01:00Europe/Rome11#19 novembre 2024#!30Mar, 19 Nov 2024 11:47:21 +0100+01:002130#/30Mar, 19 Nov 2024 11:47:21 +0100+01:00-11Europe/Rome3030Europe/Rome202430#!30Mar, 19 Nov 2024 11:47:21 +0100+01:00Europe/Rome11#Sans commentaires

Intelligence artificielle Et "Syndrome de la vache folle

L'intelligence artificielle (IA) est confrontée à une nouvelle crise, cette fois interne. Une étude récente menée par des chercheurs de Rice et de l'Université Stanford indique que l'utilisation massive de données synthétiques pour entraîner des modèles d'IA peut entraîner de graves problèmes. Cette tendance inquiétante a été baptisée « trouble de l'autophagie des modèles » ou MAD, un terme qui semble alarmant à juste titre.

Qu'est-ce qu'un ensemble de données synthétiques ?

Avant d'entrer dans les détails, il est essentiel de comprendre ce que sont les ensembles de données synthétiques. Il s'agit d'ensembles de données générées artificiellement, plutôt que collectées dans le monde réel. Ces ensembles de données servent à entraîner des modèles d'apprentissage automatique et incluent une variété de données, allant du texte et des images générés par algorithme aux données financières simulées. Leur attrait réside principalement dans leur disponibilité, leur faible coût et l'absence de préoccupations en matière de confidentialité.

Les avantages des ensembles de données synthétiques

La puissance des données synthétiques réside dans leur polyvalence et leur simplicité d'utilisation. Elles ne nécessitent aucune collecte manuelle, échappent aux préoccupations juridiques en matière de confidentialité et peuvent être créées en volumes quasi infinis. Le cabinet de conseil Gartner prévoit que d'ici 2030, ces ensembles de données remplaceront les données réelles dans de nombreux domaines d'application de l'IA.

Le syndrome de la « vache folle » dans l’apprentissage automatique

Mais il y a un côté sombre. L'étude mentionnée ci-dessus aborde un phénomène comparable au surapprentissage en apprentissage automatique, appelé « trouble de l'autophagie des modèles » (TAMM). Ce terme technique décrit un trouble où les performances d'un modèle d'IA commencent à s'éroder avec l'utilisation continue de données synthétiques. Autrement dit, l'IA commence à « perdre la raison ».

Causes et conséquences de MAD

Le problème semble provenir d'un manque de diversité des données synthétiques. Lorsqu'un modèle d'IA est entraîné sur un ensemble de données trop homogène, il commence à se chevaucher dans un cycle destructeur. Ce phénomène a été qualifié d'« autophagie », d'où le terme MAD.

Solutions proposées et considérations futures

Tout n'est cependant pas perdu. Les chercheurs suggèrent que l'intégration de données réelles au cycle d'apprentissage pourrait prévenir ce type d'érosion des modèles. Tandis que la communauté scientifique explore des solutions, il est essentiel que les développeurs d'IA soient conscients de ce risque potentiel.

Ensembles de données synthétiques : une arme à double tranchant ?

En conclusion, si les ensembles de données synthétiques offrent des avantages évidents en termes de coût, d'efficacité et de confidentialité, ils comportent également des risques nouveaux et inattendus. Christian Internò, chercheur en apprentissage automatique, résume parfaitement le dilemme : « Les données synthétiques représentent l'avenir, mais nous devons apprendre à les gérer. » Tournée vers l'avenir, la communauté de l'IA doit équilibrer les risques et les avantages de cette nouvelle frontière des données.

Laisser un commentaire