NEWS #Digitale : envie de recevoir nos meilleurs articles ?  Inscription → 

Qwen 2.5-Max : Alibaba défie DeepSeek et OpenAI avec un modèle IA surpuissant

Alibaba frappe fort avec Qwen 2.5-Max, la nouvelle version de son modèle d’intelligence artificielle, affirmant surpasser les références actuelles comme GPT-4o, DeepSeek-V3 et Llama-3.1-405B. Ce lancement, effectué en plein Nouvel An lunaire, souligne l’urgence pour Alibaba de réaffirmer sa position face à la montée en puissance de DeepSeek et des autres géants de l’IA.
Qwen IA Alibaba

Qwen 2.5-Max : un modèle Mixture-of-Experts entraîné sur 20 000 milliards de tokens

Qwen 2.5-Max repose sur l’architecture Mixture-of-Experts (MoE), une approche qui permet d’améliorer la puissance et l’efficacité des modèles en activant seulement une partie de leurs paramètres à chaque requête.

Cette version a été préentraînée sur plus de 20 000 milliards de tokens et bénéficie d’un affinage supervisé (SFT) et d’un apprentissage par renforcement à partir du feedback humain (RLHF).

L’objectif d’Alibaba est clair : rivaliser avec les meilleurs modèles du marché et s’imposer comme un acteur clé dans l’IA générative.

Des performances de pointe face aux modèles leaders

Alibaba annonce des résultats impressionnants aux benchmarks IA, comparant Qwen 2.5-Max à DeepSeek-V3, GPT-4o, et Claude-3.5-Sonnet sur des tests clés :

  • Arena-Hard : mesure des préférences humaines
  • LiveBench : évaluation des capacités générales
  • LiveCodeBench : test des performances en codage
  • MMLU-Pro : évaluation des connaissances sur des questions de niveau universitaire
Qwen 2.5 max - Benchmark
Qwen 2.5 max – Benchmark

Les tests montrent que Qwen 2.5-Max surpasse DeepSeek-V3 dans plusieurs de ces évaluations et affiche des résultats compétitifs face à GPT-4o et Claude-3.5-Sonnet, bien que ces derniers ne soient pas directement accessibles pour comparaison des modèles de base.

Un lancement stratégique en pleine bataille pour la suprématie IA

Ce lancement intervient dans un contexte tendu : la startup DeepSeek a récemment ébranlé l’industrie en dévoilant un modèle de raisonnement performant pour 95 % moins cher que GPT-4o.

Cela a provoqué un séisme sur les marchés, faisant chuter les actions de Nvidia et accélérant la réaction des autres géants du secteur.

Face à cette concurrence accrue, Alibaba ne pouvait pas rester spectateur.

Le choix de dévoiler Qwen 2.5-Max le premier jour du Nouvel An chinois, un jour habituellement férié, montre l’urgence pour le groupe de répondre à DeepSeek et de rassurer investisseurs et clients sur sa compétitivité.

Qwen 2.5-Max disponible en API et sur Qwen Chat

Les entreprises et développeurs peuvent dès maintenant tester Qwen 2.5-Max via l’API disponible sur Alibaba Cloud ou directement via l’interface en ligne accessible ici.

Aperçu de l'interface de Qwen Chat
Aperçu de l’interface de Qwen Chat

Compatible avec l’API d’OpenAI, son intégration est facilitée pour ceux déjà familiers avec les modèles de ChatGPT.

Alibaba vs DeepSeek : qui dominera la prochaine génération d’IA ?

La bataille entre les IA chinoises Alibaba et DeepSeek reflète l’accélération de la course à l’IA en Chine, mais aussi au niveau mondial.

Avec des modèles toujours plus performants et accessibles, cette rivalité pourrait redessiner le paysage technologique et influencer l’avenir de l’intelligence artificielle.

Reste à voir si Qwen 2.5-Max tiendra ses promesses et comment ses concurrents réagiront à cette nouvelle avancée…

Un avis ? post

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *