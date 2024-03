MM1 est une nouvelle méthode novatrice pour former des modèles de langue étendus, intégrant du texte et des informations de manière fluide

MM1, le nouveau modèle d’IA d’Apple

On murmure qu’Apple est plongée dans le développement de l’Intelligence Artificielle (IA), explorant même des partenariats avec des entreprises telles que Google pour intégrer Gemini dans l’iPhone. Récemment, des progrès ont été révélés concernant une nouvelle méthode pour former des modèles de langue étendus, intégrant du texte et des informations de manière fluide. Selon l’article de recherche, une approche novatrice est présentée pour la création de systèmes d’IA plus intelligents et adaptables. Ce nouveau modèle d’IA, appelé MM1, établit une norme en termes de capacité de l’IA à effectuer des actions telles que ajouter des sous-titres à des images ou fournir des réponses visuelles à certaines questions.

Apple et l’IA se rapprocheront bientôt

La recherche d’Apple se concentre sur la combinaison de différents types de données d’entraînement et d’architectures de modèles, ce qui permet à l’IA de comprendre et de générer du langage basé sur une combinaison de signaux visuels et linguistiques. Cette capacité est cruciale pour les tâches qui nécessitent une compréhension détaillée du monde, comme l’interprétation d’images complexes ou la réponse à des questions impliquant des éléments visuels.

Le modèle MM1 est décrit comme une série de modèles multimodaux de dernière génération avec des caractéristiques remarquables, telles qu’un « apprentissage contextuel amélioré » et un « raisonnement basé sur plusieurs images ». Cette nouvelle famille de modèles démontre des performances exceptionnelles et compétitives dans un large éventail de tests.

Bien qu’il soit difficile de comprendre pleinement le travail des chercheurs d’Apple, nous pouvons résumer qu’ils combinent différents types de données et d’architectures de modèles. L’IA en question devra générer du langage basé sur un mélange de signaux visuels et linguistiques, ce qui pourrait être utile pour interpréter des images ou des vidéos, répondre à des questions sur des éléments visuels à l’écran, entre autres fonctions.

Apple ne veut pas rester à la traîne dans la compétition de l’IA et semble s’y investir pleinement cette année. Des acquisitions telles que DarwinAI, pour faciliter l’exécution de fonctions d’IA sur l’iPhone ou tout ce qui se murmure pour iOS 18 comme un assistant entièrement repensé, semblent n’être que la partie visible de l’iceberg.