Le modèle IA QwQ-32B-Preview d’Alibaba bat OpenAI sur des tests de raisonnement mathématique. Découvrez ses caractéristiques !
Le modèle IA QwQ-32B-Preview d’Alibaba bat OpenAI sur des tests de raisonnement mathématique. Découvrez ses caractéristiques !
Développé par le laboratoire Qwen d’Alibaba, QwQ-32B-Preview est un modèle IA open source sous licence Apache 2.0 qui repose sur 32,5 milliards de paramètres et peut traiter des prompts allant jusqu’à 32 000 mots.
Sa force principale ? Sa capacité à résoudre des problèmes complexes en mathématiques ou en programmation, en étant au plus proche du raisonnement humain, en décomposant chaque étape.
Pour preuve de son efficacité, sur les benchmarks AIME et MATH (des références dans l’évaluation des compétences en mathématiques et en résolution de problèmes), QwQ-32B-Preview a battu les modèles d’OpenAI.
Bien que QwQ-32B-Preview excelle dans les tests de raisonnement logique et mathématique, il possède tout de même quelques limites. Notamment, pour certaines résolutions, il opte pour un raisonnement circulaire c’est-à-dire qu’il répète les mêmes étapes sans arriver à une conclusion, ou encore, il peut aussi mélanger aléatoirement les langues dans les réponses générées.
De plus, en tant qu’entreprise chinoise, Alibaba est soumis à des restrictions gouvernementales. Des mesures de protection supplémentaires ont été ajoutées pour éviter les réponses inappropriées ou biaisées, notamment dans les domaines sensibles comme la santé, la finance ou la politique. Son déploiement est surveillé pour éviter les dérives.
Grâce à ses capacités avancées, QwQ-32B-Preview ouvre de nouvelles perspectives dans de nombreux domaines :
QwQ peut être un outil d’aide pour les développeurs dans la génération de code et la résolution de problèmes techniques comme la détection et correction d’erreurs ou encore la création d’algorithmes.
Avec son score impressionnant sur le benchmark GPQA, QwQ pourrait permettre d’analyser des données et soutenir la recherche en physique ou biologie sur des problèmes qui n’ont pas été résolus jusqu’ici.
QwQ peut également être intégré dans des systèmes industriels notamment pour l’automatisation des détections de pannes ou encore améliorer la maintenance prédictive pour prévenir les dysfonctionnements.
L’arrivée de QwQ montre que la Chine est prête à rivaliser sur le terrain du raisonnement avancé et des modèles open source.
En publiant son modèle sous licence Apache 2.0, Alibaba adopte une stratégie qui vise à démocratiser l’accès aux technologies avancées tout en stimulant l’innovation au sein de l’écosystème open source. Ce choix contraste avec la relative opacité de certains modèles concurrents comme les modèles o1 d’OpenAI, dont le nombre de paramètres reste inconnu.
Source : Qwenlm.github.io
Avant de se quitter…
Si cet article sur la sortie de QwQ-32B-Preview vous a plu, n’hésitez pas à le partager sur les réseaux sociaux, à vous abonner à notre newsletter digitale et/ou à nous suivre sur Google Actualités pour recevoir nos prochains articles.
Vous pouvez également suivre nos meilleurs articles via notre flux RSS : https://www.leptidigital.fr/tag/newsletter-digitale/feed/ (il vous suffit de l’insérer dans votre lecteur de flux RSS préféré (ex : Feedly)).
Nous sommes aussi actifs sur LinkedIn, X, Facebook, Threads et YouTube. On s’y retrouve ?
Anciennement E-Store Manager et Social Media Manager en agence et chez l’annonceur, je m’intéresse principalement aux sujets liés au Community Management, au Social Media Advertising et au E-commerce au sens large. Je suis aussi toujours à l’affût des dernières tendances webmarketing et couvre ces sujets pour LEPTIDIGITAL. Pour me contacter : [email protected]
Ça fait un peu bizzare que dans un pays libre et démocratique avec des entreprise avec « openAI » comme nom ne propage que des logiciels fermés, alors que d’un autre côté on a un pays quasi-totalitaire qui publie un modèle d’ia à code ouvert.
un autre logiciel qui hallucine et ment…
c’est donc juste pas au point. ça ne devrait pas quitter un laboratoire.
On attend essentiellement d’une IA rigueur et précision.