
Accès rapide (Sommaire) :
Qwen 2.5-Max : un modèle Mixture-of-Experts entraîné sur 20 000 milliards de tokens
Qwen 2.5-Max repose sur l’architecture Mixture-of-Experts (MoE), une approche qui permet d’améliorer la puissance et l’efficacité des modèles en activant seulement une partie de leurs paramètres à chaque requête.
Cette version a été préentraînée sur plus de 20 000 milliards de tokens et bénéficie d’un affinage supervisé (SFT) et d’un apprentissage par renforcement à partir du feedback humain (RLHF).
L’objectif d’Alibaba est clair : rivaliser avec les meilleurs modèles du marché et s’imposer comme un acteur clé dans l’IA générative.
Des performances de pointe face aux modèles leaders
Alibaba annonce des résultats impressionnants aux benchmarks IA, comparant Qwen 2.5-Max à DeepSeek-V3, GPT-4o, et Claude-3.5-Sonnet sur des tests clés :
- Arena-Hard : mesure des préférences humaines
- LiveBench : évaluation des capacités générales
- LiveCodeBench : test des performances en codage
- MMLU-Pro : évaluation des connaissances sur des questions de niveau universitaire

Les tests montrent que Qwen 2.5-Max surpasse DeepSeek-V3 dans plusieurs de ces évaluations et affiche des résultats compétitifs face à GPT-4o et Claude-3.5-Sonnet, bien que ces derniers ne soient pas directement accessibles pour comparaison des modèles de base.
Un lancement stratégique en pleine bataille pour la suprématie IA
Ce lancement intervient dans un contexte tendu : la startup DeepSeek a récemment ébranlé l’industrie en dévoilant un modèle de raisonnement performant pour 95 % moins cher que GPT-4o.
Cela a provoqué un séisme sur les marchés, faisant chuter les actions de Nvidia et accélérant la réaction des autres géants du secteur.
Face à cette concurrence accrue, Alibaba ne pouvait pas rester spectateur.
Le choix de dévoiler Qwen 2.5-Max le premier jour du Nouvel An chinois, un jour habituellement férié, montre l’urgence pour le groupe de répondre à DeepSeek et de rassurer investisseurs et clients sur sa compétitivité.
Qwen 2.5-Max disponible en API et sur Qwen Chat
Les entreprises et développeurs peuvent dès maintenant tester Qwen 2.5-Max via l’API disponible sur Alibaba Cloud ou directement via l’interface en ligne accessible ici.

Compatible avec l’API d’OpenAI, son intégration est facilitée pour ceux déjà familiers avec les modèles de ChatGPT.
Alibaba vs DeepSeek : qui dominera la prochaine génération d’IA ?
La bataille entre les IA chinoises Alibaba et DeepSeek reflète l’accélération de la course à l’IA en Chine, mais aussi au niveau mondial.
Avec des modèles toujours plus performants et accessibles, cette rivalité pourrait redessiner le paysage technologique et influencer l’avenir de l’intelligence artificielle.
Reste à voir si Qwen 2.5-Max tiendra ses promesses et comment ses concurrents réagiront à cette nouvelle avancée…

Fondateur de LEPTIDIGITAL et consultant spécialisé en acquisition de leads B2B (SaaS) et SEO. Passionné par le marketing digital, l’intelligence artificielle et le référencement naturel, il possède une solide expérience dans ces domaines. Au fil de sa carrière, il a occupé des postes clés en tant que SEO Manager et responsable e-commerce pour plusieurs grandes entreprises, dont Altice Media, Infopro Digital, Voyage Privé et le Groupe ERAM. Sur le plan personnel, c’est un curieux insatiable, également passionné par la photographie, le badminton et les voyages. Pour toute demande de partenariat, privilégiez une prise de contact via LinkedIn ou par email à [email protected].