Les entreprises tech explorent un nouveau paradigme en l’intelligence artificielle, où l’humain redevient central. Au lieu de simples données, elles capturent des moments de vie de travailleurs, offrant aux machines une compréhension authentique des tâches humaines et enrichissant ainsi leur apprentissage avec une qualité inégalée.
Au cœur de l’avancement de l’intelligence artificielle, les données sont désormais considérées comme le bien le plus précieux. Avoir des modèles puissants ou des infrastructures massives ne suffit plus; la qualité de l’information utilisée pour entraîner ces machines fait vraiment la différence. Pour cette raison, certaines entreprises tech se tournent de nouveau vers les humains, non plus comme de simples annotateurs, mais comme acteurs de leur quotidien, filmé et transformé en matière première pour les futurs modèles d’IA.
Taylor (une artiste interviewée par Tech Crunch qui a demandé à rester anonyme) a participé à cette nouvelle expérience. Pendant une semaine de l’été, elle et sa colocataire ont porté des caméras GoPro fixées à leur front pendant qu’elles peignaient, sculptaient ou faisaient la vaisselle. Chaque activité était soigneusement synchronisée pour former un modèle de vision par ordinateur développé par la startup Turing, qui vise à enseigner aux machines à assimiler des tâches humaines complexes à partir de séquences vidéo réelles.
“Nous nous levions, synchronisions les caméras et poursuivions notre journée, cuisinant ou créant des œuvres, » raconte Taylor. “C’était épuisant. Les sangles laissaient des marques sur ma peau et je finissais avec des maux de tête.”
Le but de Turing n’était pas d’apprendre au modèle à peindre, mais plutôt à donner à l’IA une compréhension visuelle et séquentielle du monde physique, allant de la découpe d’un oignon à la préparation du ciment ou à la réparation d’une prise. Pour cela, l’entreprise engage des artistes, des cuisiniers, des ouvriers et des techniciens. Selon Sudarshan Sivaraman, directeur de l’AGI (intelligence artificielle générale) chez Turing, l’approche manuelle est essentielle pour obtenir une base de données véritablement variée: « Nous enregistrons tous types de travaux manuels pour que le modèle comprenne comment réaliser une tâche. La diversité est cruciale durant la phase de préentraînement.”
Des algorithmes voraces à la valeur de l’expérience humaine
Ce que fait Turing illustre un changement profond dans le secteur de l’IA. Dans les premières années du boom, les entreprises alimentaient leurs modèles avec des données issues d’internet (sites web, forums, réseaux sociaux) sans véritable filtre ni contrôle de qualité. Aujourd’hui, les entreprises leaders sont prêtes à investir des sommes importantes dans des ensembles de données précis, propres et exclusifs.
La logique est simple: la puissance brute des modèles est déjà atteinte; le véritable avantage concurrentiel réside désormais dans des données privées et bien entretenues. Plutôt que de sous-traiter le travail à des plateformes anonymes, de nombreuses sociétés préfèrent collecter leurs propres informations ou superviser directement leur création.
Un exemple est Fyxer, une entreprise qui utilise l’IA pour organiser les emails et rédiger des réponses. Son fondateur, Richard Hollingsworth, a expliqué qu’après plusieurs tests, ils avaient découvert que la performance de leur système dépendait moins de la quantité de données que de leur qualité. “Ce qui définit réellement les performances, ce n’est pas le volume, mais la précision de l’ensemble de données,” a-t-il affirmé.
Concrètement, cela a entraîné une situation originale: durant les premiers mois, les ingénieurs et dirigeants étaient moins nombreux que les assistants exécutifs, des professionnels chargés de former le modèle sur les subtilités de la communication email. « Nous avions besoin d’experts en relations humaines, des personnes capables de juger quand un email mérite une réponse et quand il ne le mérite pas. C’est un problème profondément humain,” a expliqué Hollingsworth.
Avec le temps, le processus est devenu plus sélectif: moins de volume, plus de contrôle. À l’instar de Turing, l’obsession pour la curation des données a surpassé l’enthousiasme pour les échelles massives. Dans le cas du modèle visuel, Sivaraman estime qu’entre 75 % et 80 % des données utilisées par Turing sont synthétiques, générées à partir des enregistrements originaux. Cela augmente seulement l’importance du matériel de base: “Si le préentraînement ne repose pas sur des données de bonne qualité, tout ce qui en découle sera défectueux,” a-t-il expliqué.
Cette approche présente aussi une logique stratégique. Dans un environnement où tout le monde peut utiliser des modèles open-source, le véritable atout réside dans les données propriétaires. Pour des entreprises comme Fyxer, le travail de collecte et d’annotation humaine devient un obstacle difficile à surmonter pour la concurrence. “Nous estimons que la meilleure façon d’avancer, c’est à travers les données: des modèles sur mesure, un entraînement humain de haute qualité,” a résumés Hollingsworth.
Au premier abord, la méthode peut sembler un pas en arrière dans un monde automatisé: des humains enregistrant chacun de leurs mouvements pour enseigner aux machines. Pourtant, cela rappelle que l’intelligence artificielle doit encore apprendre à partir de l’expérience humaine directe. Sans ces heures d’observation (de pinceaux, de câbles et de poêles), les modèles seraient de simples collecteurs de motifs statistiques sans intérêt pratique.
Par conséquent, tandis que la question de l’émergence de l’intelligence générale artificielle se pose, Turing et d’autres entreprises investissent dans ce qui pourrait bien être leur atout le plus précieux: la compréhension authentique du comportement humain. Peut-être que l’avenir de l’IA ne se construira pas dans des laboratoires fermés, mais dans des foyers et des ateliers où des personnes comme Taylor continuent d’enseigner aux machines ce que signifie vivre et créer dans le monde physique.
