Les experts soulignent que l’IA a besoin de plus de « nourriture ».

L’IA a toujours besoin de nouvelles données pour apprendre

L’intelligence artificielle est la révolution dont la technologie avait besoin pour faire un bond en avant dans de nombreux aspects de notre vie. Évidemment, cela comporte des risques, ce qui a suscité des inquiétudes concernant les métiers qui vont disparaître en raison de sa mise en place de plus en plus active dans chaque niche où elle peut s’implanter. Cela ne signifie pas qu’elle est exempte de problèmes, bien au contraire, mais il est clair que, pour le moment au moins, elle ne menace pas directement l’humanité, mais elle nous servira de support clé.

Cependant, l’IA a un problème clé qui semble devenir de plus en plus apparent : elle n’a pas suffisamment de données pour continuer à alimenter son algorithme pendant longtemps. Nous avons besoin de tonnes de données pour former nos IA, mais le monde devient de plus en plus pauvre en contenu à leur montrer.

Bien qu’il soit vrai qu’un plus grand volume de données ne signifie pas toujours de meilleures performances, d’autre part, il faut garder à l’esprit que cela représente une source de connaissances plus large qui peut nous donner de meilleurs résultats dans nos requêtes.

L’IA se nourrit de données

D’après ScienceAlert, ChatGPT a été formé avec plus de 300 milliards de mots de données textuelles représentant plus de 570 Go. Pendant ce temps, DALL-E a été nourri avec 5,8 milliards d’images pour que son algorithme soit suffisamment formé pour cette mission.

Pour alimenter l’algorithme qui maintient ses capacités maximales, il ne suffit pas d’avoir du contenu en abondance, il faut que ce contenu soit de bonne qualité. Qu’il provienne de livres spécialisés, d’articles scientifiques et de contenu web dévoilé et criblé pour éviter que la désinformation se glisse par les fissures de la connaissance de nos IA préférées.

Cependant, les prévisions ne sont pas encourageantes. Selon un groupe de chercheurs qui a publié un article en accès libre sur Arxiv, nous nous retrouverons très bientôt sans ces informations nécessaires pour continuer à former l’IA. Plus précisément, on estime qu’en 2026, il n’y aura pas suffisamment d’informations pour continuer à former l’IA et qu’il ne restera que des informations de basse qualité qui s’épuiseront entre 2030 et 2050.

Les amateurs d’IA peuvent être rassurés car ce n’est pas aussi grave qu’il n’y paraît. La prochaine étape consistera à améliorer leurs algorithmes pour les rendre plus intelligents et ainsi traiter plus efficacement le volume de données existant. En résumé, l’aspect le plus important à partir de maintenant sera d’améliorer l’algorithme, de le rendre plus proche de nous tant dans son comportement que dans ses raisonnements, afin qu’il soit véritablement utile lorsque nous essayons de l’utiliser comme outil d’analyse.

En réalité, il est inutile d’avoir une grande quantité de données dans l’IA si celle-ci n’est pas suffisamment affinée pour savoir en faire un usage plus intelligent des informations qui lui sont fournies.

