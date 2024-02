Gemini 1.5 est là, une nouvelle version de son modèle de langage, lancée avec Gemini 1.5 Pro

Gemini est le nom du modèle IA multimodal de Google

Juste une semaine après avoir annoncé l’arrivée du chatbot Gemini en remplacement de Bard, et avoir ouvert la disponibilité de Gemini Ultra, leur modèle le plus avancé, la société vient d’annoncer l’arrivée de la nouvelle génération de leur modèle d’intelligence artificielle : Gemini 1.5, disponible dès aujourd’hui pour certains utilisateurs.

Il s’agit d’une mise à jour du modèle, qui selon la société elle-même, utilise une nouvelle approche de « Mixture-of-Experts » visant à améliorer l’efficacité en dirigeant les demandes des utilisateurs vers un sous-groupe de réseaux neuronaux « experts » plus petits, capables de fournir des réponses plus rapides et de meilleure qualité.

Gemini 1.5 étend le nombre de tokens à 1 000 000

La première version de Gemini 1.5 est disponible via le modèle Gemini Pro. À cet égard, Google explique qu’elle offre une qualité de réponse comparable à celle de Gemini 1.0 Ultra, mais avec une consommation de ressources nettement inférieure.

Une de ses principales nouveautés réside dans l’extension du nombre de tokens que le modèle peut traiter. Jusqu’à présent, la limite était de 200 000 tokens (Claude 2.1, modèle d’Anthropic), mais il a été possible d’étendre la fenêtre contextuelle jusqu’à celle la plus grande jamais utilisée dans n’importe quel modèle fondamental à grande échelle. Gemini 1.5 étend le nombre de tokens à 1 million.

In Décembre, we launched Gemini 1.0 Pro. Today, we’re introducing Gemini 1.5 Pro! 🚀 This next-gen model uses a Mixture-of-Experts (MoE) approach for more efficient training & higher-quality responses. Gemini 1.5 Pro, our mid-sized model, will soon come standard with a… pic.twitter.com/m2BNufHd8C — Sundar Pichai (@sundarpichai) 15 février 2024

Étant donné qu’il s’agit d’un système avec des capacités multimodales, cette extension de la fenêtre contextuelle implique que Gemini 1.5 offre de nouvelles formes d’interaction avec le modèle, allant de l’interprétation de livres entiers, de vastes collections de documents, de vidéos longues (comme des films ou des séries complètes), d’audios jusqu’à des dizaines de milliers de lignes de code.

Sur la vidéo ci-dessous, on peut voir Gemini 1.5 Pro analyser, classer et résumer les transcriptions des 402 pages de la mission Apollo 11 vers la Lune.

Avec Gemini 1.5, Google a également réussi à établir une architecture plus efficace, permettant au modèle d’apprendre des tâches complexes plus rapidement tout en maintenant la qualité.

Dès aujourd’hui, les développeurs et les utilisateurs professionnels peuvent commencer à expérimenter Gemini 1.5 Pro via AI Studio et Vertex AI. Ce modèle sera progressivement intégré aux autres services et plateformes basés sur Gemini déjà proposés par l’entreprise aux utilisateurs.

Avec l’arrivée de Gemini 1.5, par ailleurs, Google a également mis à jour le modèle Gemini 1.0 pour réduire le prix de sa version stable pour les développeurs souhaitant créer des services et plateformes basés sur la version antérieure du modèle.