YouTube et l'utilisation des vidéos pour former des IA : enjeux et perspectives

Les entreprises technologiques exploitent les contenus de YouTube pour former leurs modèles d’IA, souvent à l’insu des créateurs. Google utilise des vidéos de cette plateforme pour entraîner ses systèmes, renforçant ainsi des préoccupations sur la protection des droits des auteurs. L’introduction du modèle Veo 3 soulève des questions sur l’impact futur sur les créateurs.

Lorsque les sociétés technologiques entraînent leurs modèles d’IA, il semblerait que tout soit permis. Par exemple, Google utilise des milliards de vidéos sur YouTube pour former Gemini et Veo 3, et de nombreux créateurs ne sont pas conscients de ce fait.

Avec plus de 20 milliards de vidéos sur la plateforme, YouTube représente une mine de données exploitables pour les entreprises d’IA, et beaucoup l’ont déjà fait.

Le propriétaire de YouTube, Google, utilise également du contenu pour former ses modèles d’IA, rapportent CNBC. La société a confirmé qu’elle procédait de la sorte, mais qu’elle n’utilise qu’un sous-ensemble de vidéos et qu’elle respecte des accords spécifiques avec les créateurs et les entreprises médiatiques.

YouTube a reconnu qu’il était nécessaire d’établir des protections, ce qui explique pourquoi des investissements ont été faits pour permettre aux créateurs de protéger leur image et leur ressembiance.

Cependant, de nombreux experts soulignent que la plupart des créateurs et des entreprises ignorent que Google entraîne ses modèles avec leur contenu. Il n’existe également aucun moyen pour les utilisateurs d’opter pour ne pas avoir leurs créations utilisées de cette manière.

Le rapport indique que la taille de la bibliothèque vidéo de YouTube signifie que même si seulement 1 % des vidéos sont utilisées à des fins de formation, cela représente 2,3 milliards de minutes de contenu, soit plus de 40 fois la quantité de données d’entraînement utilisée par des modèles d’IA concurrents, selon les experts.

La situation est devenue plus pertinente depuis que Google a annoncé son modèle vidéo Veo 3, capable de créer des clips vidéo incroyablement réalistes. Comme dans de nombreux domaines, il est ironique que le contenu créé par les personnes soit utilisé pour entraîner une IA qui pourrait éventuellement les remplacer ou altérer leurs revenus dans un marché compétitif.

Certaines personnes adoptent un point de vue différent ; elles utilisent ou envisagent d’utiliser Veo 3 pour créer du contenu, même s’il a été formé sur leur propre travail original.

Des cas ont été signalés concernant d’autres sociétés utilisant YouTube pour entraîner leurs IA sans que les créateurs en soient informés. L’année dernière, il a été rapporté qu’OpenAI avait transcrit plus d’un million d’heures de vidéos YouTube pour former ses LLMs. NVIDIA a réalisé la même opération, grattant jusqu’à 80 ans de vidéos par jour – la société a soutenu que cela se faisait dans « l’esprit de la loi sur le droit d’auteur ». Anthropic, Apple et Salesforce ont également fait appel à YouTube pour leurs données d’entraînement à l’IA.

Google permet désormais aux créateurs de se retirer de la formation d’IA par des entreprises tierces comme Amazon et NVIDIA, mais il n’existe aucune option pour empêcher Google de faire de même.

YouTube et l’utilisation des vidéos pour former des IA : enjeux et perspectives

Offres JIMMY Prime Day : Grosses réduction sur les purificateurs d’eau et aspirateurs anti-acariens

Lymow One Plus : la tondeuse autonome aux doubles lames rotatives à -18% !

Jimmy : Aspirateurs anti-acariens indispensables en promo jusqu’au 26 juin !

Tu n’es pas fou, il y a une raison pour laquelle la batterie de ton téléphone tient moins longtemps en été

Tout ce que vous pouvez faire pour résoudre les problèmes de l’application Cita Sanitaria avant de vous décourager

Mole l’outil gratuit pour nettoyer optimiser et surveiller votre Mac

Photoshop, Lightroom et sept autres applications pour retoucher vos photos comme un pro

China réussit à récupérer sa fusée ! La suprématie spatiale de Elon Musk menacée

TEST UGREEN Maxidok 17 en 1 Thunderbolt 5 : Notre verdict sur la station d’accueil qui fait tout

TEST AFERIY P280 + Extension : Batterie de 4096Wh à 1439€, le meilleur rapport qualité-prix ?

TEST UGREEN Maxidok 10 en 1 Thunderbolt 5 pour Mac Mini : La station d’accueil parfaitement taillée ?