Google utilise un nouveau modèle d’IA pour tenter de déchiffrer les sons des dauphins afin de faciliter la communication avec ces mammifères marins. Ce projet, en collaboration avec des chercheurs, vise à comprendre les différents bruits émis par les dauphins et leur signification comportementale.
Google a récemment annoncé sa collaboration avec des chercheurs du Georgia Tech et le travail de terrain du Wild Dolphin Project (WDP). Ce dernier collecte des données sur les sons que produisent les dauphins et leur relation avec le comportement de ces animaux depuis plus de 40 ans.
Auparavant, les chercheurs avaient établi des corrélations entre les types de sons et les contextes comportementaux. Les dauphins possèdent des sifflements caractéristiques utilisés comme des noms, permettant aux mères de retrouver leurs petits. Ils utilisent souvent des « buzz » cliquetants lors des comportements de cour et de poursuite de requins, tandis que les « squarks » à impulsion sont observés lors des combats.
![]()
DolphinGemma, basé sur les modèles d’IA Gemma de Google, a été formé sur le vaste ensemble de données de sons de dauphins et les notes qui l’accompagnent fournies par le WDP.
Ce n’est pas seulement l’IA de Google qui est utilisée par le projet. Les chercheurs de terrain utilisent des Pixel pour enregistrer les sons des dauphins.
Les Pixels traitent le son à travers le SoundStream de Google, permettant d’alimenter le modèle avec les bruits au fur et à mesure de leur enregistrement. Google précise que le modèle DolphinGemma, composé de 400 millions de paramètres, est parfaitement dimensionné pour fonctionner directement sur les téléphones Pixel utilisés par le WDP sur le terrain.
![]()
L’utilisation des téléphones Pixel permet également de réduire considérablement le besoin en hardware coûteux et de diminuer les coûts, écrit Google.
DolphinGemma fonctionne de manière similaire à d’autres modèles de langage. Il analyse des séquences de sons de dauphins pour identifier des motifs, des structures, et finalement prédire les sons suivants les plus probables dans une séquence.
Le WDP a également formé un partenariat avec l’Institut de Technologie de Georgie sur le projet CHAT (Cetacean Hearing Augmentation Telemetry), qui se base sur le Pixel 6. Ce projet crée des sifflets synthétiques et essaie de les associer à des objets spécifiques que les dauphins apprécient, tels que la sargasse, l’, ou des foulards utilisés par les chercheurs. L’objectif est que les dauphins imitent les sons qu’ils entendent pour demander ces objets.

Le but ultime de CHAT est de permettre une interaction de base bidirectionnelle avec les dauphins. Google annonce qu’un nouveau CHAT basé sur le Pixel 9 sera prêt pour la saison de recherche de l’été 2025.
CHAT fonctionne en tandem avec DolphinGemma. Le LLM utilise son pouvoir prédictif pour aider CHAT à anticiper et identifier plus tôt les imitations potentielles dans la séquence de vocalisation, augmentant ainsi la rapidité avec laquelle les chercheurs peuvent réagir aux dauphins et rendant les interactions plus fluides et renforçant l’engagement.
On espère que la technologie de Google pourra éviter ce scénario potentiel :
