NEWS #Digitale : envie de recevoir nos meilleurs articles ?  Inscription → 

Mistral Pixtral 12B : un modèle IA multimodal capable d’analyser les images

Alors qu’OpenAI a présenté GPT-4o, son modèle multi-modal capable d’interagir avec du texte, des images ou un flux vidéo, la startup française concurrente Mistral a dévoilé son premier modèle IA multimodal. Baptisé Pixtral 12B, ce dernier est à la fois capable de traiter du texte et des images, une première pour Mistral ! Voici ce sue l’on sait à son sujet.
Mistral IA
Mistral IA

Pixtral 12B : un nouveau modèle puissant de 12 milliards de paramètres, capable de traiter les images

Le nouveau modèle Pixtral 12B compte pas moins de 12 milliards de paramètres, une mesure qui indique la complexité et la capacité d’un modèle IA.

En règle générale, plus un modèle a de paramètres, plus il est capable de résoudre des problèmes complexes. Avec une taille d’environ 24 Go, ce modèle est conçu pour être à la fois robuste et flexible.

Le développement de Pixtral repose sur Nemo 12B, un modèle texte également créé par Mistral.

Cette base solide lui permet d’étendre ses compétences textuelles aux images, ouvrant ainsi la voie à des applications multimodales, c’est-à-dire capables de comprendre et d’interpréter différents types de données, telles que des images et du texte.

De nouvelles possibilités offertes grâce à Pixtral 12B

Bien que nous n’ayons pas pu le tester encore, le modèle Pixtral 12B devrait ainsi être capable d’effectuer une variété de tâches liées aux images et au texte.

Il devrait ainsi par exemple pouvoir décrire des images, analyser ce qui est contenu dans une image ou encore répondre à des questions portant sur l’image en elle-même.

Bien que ces options soient déjà intégrées dans d’autres modèles multimodaux comme Claude d’Anthropic ou GPT-4o d’OpenAI, il s’agit d’une première étape encourageante et importante pour la startup française en plein développement !

Comment accéder et utiliser le modèle ?

Aperçu des fichiers de Pixtral 12B sur HuggingFace
Aperçu des fichiers de Pixtral 12B sur HuggingFace

Pixtral 12B est disponible pour téléchargement via des plateformes comme GitHub et Hugging Face.

Ces deux plateformes permettent aux développeurs et aux chercheurs d’accéder librement au modèle, sous réserve de respecter les conditions d’utilisation de Mistral. Pour des applications commerciales, une licence payante sera par exemple requise. Pour un usage personnel, académique ou de recherche, le modèle reste libre d’utilisation.

Bien que Mistral n’ait pas encore publié une démo web permettant de tester Pixtral en temps réel, la société a annoncé que son chatbot Le Chat permettra prochainement de le tester.

L’API sera elle aussi très prochainement disponible pour les utilisateurs payants de la startup.

Avant de se quitter…

Si cet article sur Pixtral vous a plu, n’hésitez pas à le partager sur les réseaux sociaux, à vous abonner à notre newsletter marketing digitale et/ou à nous suivre sur Google Actualités pour recevoir nos prochains articles.

Vous pouvez également suivre nos meilleurs articles via notre flux RSS : https://www.leptidigital.fr/tag/newsletter-digitale/feed/ (il vous suffit de l’insérer dans votre lecteur de flux RSS préféré (ex : Feedly)).

Nous sommes aussi actifs sur LinkedIn, X, Facebook, Threads et YouTube. On s’y retrouve ?

Un avis ? post

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *