YouTube et l’utilisation des vidéos pour former des IA : enjeux et perspectives

Youtube Et L'utilisation Des Vidéos Pour Former Des Ia :

Les entreprises technologiques exploitent les contenus de YouTube pour former leurs modèles d’IA, souvent à l’insu des créateurs. Google utilise des vidéos de cette plateforme pour entraîner ses systèmes, renforçant ainsi des préoccupations sur la protection des droits des auteurs. L’introduction du modèle Veo 3 soulève des questions sur l’impact futur sur les créateurs.

Lorsque les sociétés technologiques entraînent leurs modèles d’IA, il semblerait que tout soit permis. Par exemple, Google utilise des milliards de vidéos sur YouTube pour former Gemini et Veo 3, et de nombreux créateurs ne sont pas conscients de ce fait.

Avec plus de 20 milliards de vidéos sur la plateforme, YouTube représente une mine de données exploitables pour les entreprises d’IA, et beaucoup l’ont déjà fait.

Le propriétaire de YouTube, Google, utilise également du contenu pour former ses modèles d’IA, rapportent CNBC. La société a confirmé qu’elle procédait de la sorte, mais qu’elle n’utilise qu’un sous-ensemble de vidéos et qu’elle respecte des accords spécifiques avec les créateurs et les entreprises médiatiques.

Youtube video

YouTube a reconnu qu’il était nécessaire d’établir des protections, ce qui explique pourquoi des investissements ont été faits pour permettre aux créateurs de protéger leur image et leur ressembiance.

Cependant, de nombreux experts soulignent que la plupart des créateurs et des entreprises ignorent que Google entraîne ses modèles avec leur contenu. Il n’existe également aucun moyen pour les utilisateurs d’opter pour ne pas avoir leurs créations utilisées de cette manière.

Le rapport indique que la taille de la bibliothèque vidéo de YouTube signifie que même si seulement 1 % des vidéos sont utilisées à des fins de formation, cela représente 2,3 milliards de minutes de contenu, soit plus de 40 fois la quantité de données d’entraînement utilisée par des modèles d’IA concurrents, selon les experts.

La situation est devenue plus pertinente depuis que Google a annoncé son modèle vidéo Veo 3, capable de créer des clips vidéo incroyablement réalistes. Comme dans de nombreux domaines, il est ironique que le contenu créé par les personnes soit utilisé pour entraîner une IA qui pourrait éventuellement les remplacer ou altérer leurs revenus dans un marché compétitif.

Youtube video

Certaines personnes adoptent un point de vue différent ; elles utilisent ou envisagent d’utiliser Veo 3 pour créer du contenu, même s’il a été formé sur leur propre travail original.

Des cas ont été signalés concernant d’autres sociétés utilisant YouTube pour entraîner leurs IA sans que les créateurs en soient informés. L’année dernière, il a été rapporté qu’OpenAI avait transcrit plus d’un million d’heures de vidéos YouTube pour former ses LLMs. NVIDIA a réalisé la même opération, grattant jusqu’à 80 ans de vidéos par jour – la société a soutenu que cela se faisait dans « l’esprit de la loi sur le droit d’auteur ». Anthropic, Apple et Salesforce ont également fait appel à YouTube pour leurs données d’entraînement à l’IA.

Google permet désormais aux créateurs de se retirer de la formation d’IA par des entreprises tierces comme Amazon et NVIDIA, mais il n’existe aucune option pour empêcher Google de faire de même.