Qwen 2.5-Max : Alibaba défie DeepSeek et OpenAI avec un modèle IA surpuissant

31 janvier 2025 0

Alibaba frappe fort avec Qwen 2.5-Max, la nouvelle version de son modèle d’intelligence artificielle, affirmant surpasser les références actuelles comme GPT-4o, DeepSeek-V3 et Llama-3.1-405B. Ce lancement, effectué en plein Nouvel An lunaire, souligne l’urgence pour Alibaba de réaffirmer sa position face à la montée en puissance de DeepSeek et des autres géants de l’IA.

Accès rapide (Sommaire) :

Qwen 2.5-Max : un modèle Mixture-of-Experts entraîné sur 20 000 milliards de tokens

Qwen 2.5-Max repose sur l’architecture Mixture-of-Experts (MoE), une approche qui permet d’améliorer la puissance et l’efficacité des modèles en activant seulement une partie de leurs paramètres à chaque requête.

Cette version a été préentraînée sur plus de 20 000 milliards de tokens et bénéficie d’un affinage supervisé (SFT) et d’un apprentissage par renforcement à partir du feedback humain (RLHF).

L’objectif d’Alibaba est clair : rivaliser avec les meilleurs modèles du marché et s’imposer comme un acteur clé dans l’IA générative.

Des performances de pointe face aux modèles leaders

Alibaba annonce des résultats impressionnants aux benchmarks IA, comparant Qwen 2.5-Max à DeepSeek-V3, GPT-4o, et Claude-3.5-Sonnet sur des tests clés :

Arena-Hard : mesure des préférences humaines
LiveBench : évaluation des capacités générales
LiveCodeBench : test des performances en codage
MMLU-Pro : évaluation des connaissances sur des questions de niveau universitaire

Qwen 2.5 max - Benchmark — Qwen 2.5 max – Benchmark

Les tests montrent que Qwen 2.5-Max surpasse DeepSeek-V3 dans plusieurs de ces évaluations et affiche des résultats compétitifs face à GPT-4o et Claude-3.5-Sonnet, bien que ces derniers ne soient pas directement accessibles pour comparaison des modèles de base.

Un lancement stratégique en pleine bataille pour la suprématie IA

Ce lancement intervient dans un contexte tendu : la startup DeepSeek a récemment ébranlé l’industrie en dévoilant un modèle de raisonnement performant pour 95 % moins cher que GPT-4o.

Cela a provoqué un séisme sur les marchés, faisant chuter les actions de Nvidia et accélérant la réaction des autres géants du secteur.

Face à cette concurrence accrue, Alibaba ne pouvait pas rester spectateur.

Le choix de dévoiler Qwen 2.5-Max le premier jour du Nouvel An chinois, un jour habituellement férié, montre l’urgence pour le groupe de répondre à DeepSeek et de rassurer investisseurs et clients sur sa compétitivité.

Qwen 2.5-Max disponible en API et sur Qwen Chat

Les entreprises et développeurs peuvent dès maintenant tester Qwen 2.5-Max via l’API disponible sur Alibaba Cloud ou directement via l’interface en ligne accessible ici.

Aperçu de l'interface de Qwen Chat — Aperçu de l’interface de Qwen Chat

Compatible avec l’API d’OpenAI, son intégration est facilitée pour ceux déjà familiers avec les modèles de ChatGPT.

Alibaba vs DeepSeek : qui dominera la prochaine génération d’IA ?

La bataille entre les IA chinoises Alibaba et DeepSeek reflète l’accélération de la course à l’IA en Chine, mais aussi au niveau mondial.

Avec des modèles toujours plus performants et accessibles, cette rivalité pourrait redessiner le paysage technologique et influencer l’avenir de l’intelligence artificielle.

Reste à voir si Qwen 2.5-Max tiendra ses promesses et comment ses concurrents réagiront à cette nouvelle avancée…

Un avis ? post

Vincent Brossas

Fondateur de LEPTIDIGITAL et SUPASST, je suis également consultant spécialisé en acquisition de leads B2B (SaaS). Passionné par le marketing digital, l’intelligence artificielle et le SEO. Avant de devenir indépendant, j’ai occupé des postes clés en tant que SEO Manager et responsable e-commerce pour plusieurs grandes entreprises (Altice Media, Infopro Digital, Voyage Privé et le Groupe ERAM). Sur le plan perso, je suis un curieux insatiable, également passionné par la photographie, le badminton et les voyages. Pour toute demande de partenariat, privilégiez LinkedIn ou email ([email protected]).

www.leptidigital.fr