
Et les 20 meilleurs LLMs du moment sont…
Sur la base de plus de 2 000 000 tests anonymes réalisés par des internautes bénévoles, LMSYS, en partenariat avec Hugging Face, nous révèle les meilleurs modèles IA du marché (selon les utilisateurs eux-même).
Voici un aperçu du top 20 actuel (actualisation le 07/02/2025) :
| Position | Modèle d’IA | Arena Score | Entreprise |
|---|---|---|---|
| 1 | Gemini-2.0-Flash-Thinking-Exp-01-21 | 1383 | |
| 2 | Gemini-2.0-Pro-Exp-02-05 | 1378 | |
| 3 | ChatGPT-4.0-latest-(2024-11-20) | 1365 | OpenAI |
| 4 | DeepSeek-R1 | 1362 | DeepSeek |
| 5 | Gemini-2.0-Flash-Q01 | 1357 | |
| 6 | o1-2024-12-17 | 1351 | OpenAI |
| 7 | o1-preview | 1335 | OpenAI |
| 8 | Owen2.5-Max | 1332 | Alibaba |
| 9 | DeepSeek-V3 | 1317 | DeepSeek |
| 10 | o3-mini | 1310 | OpenAI |
| 11 | Gemini-2.0-Flash-Lite-Preview | 1306 | |
| 12 | Step-2.16K-Exp | 1304 | StepFun |
| 13 | GLM-4-Plus-0111 | 1304 | Zhipu |
| 14 | o1-mini | 1305 | OpenAI |
| 15 | Gemini-1.5-Pro-002 | 1302 | |
| 16 | Grok-2.09-13 | 1288 | xAI |
| 17 | Yi:Lightning | 1287 | 01 AI |
| 18 | GPT-4.0-2024-05-13 | 1285 | OpenAI |
| 19 | Claude-3.5-Sonnet-(20241022) | 1283 | Anthropic |
| 20 | Owen2.5-Plus-1127 | 1282 | Alibaba |
Cette compétition interactive a révélé quelques surprises, notamment avec Gemini 2.0 et DeepSeek-R1, qui se hissent pour l’instant en tête du classement, devançant o1 d’OpenAI, pourtant très réputé.
Pour accéder au leaderboard le plus à jour possible :
Comment fonctionne le classement des meilleurs modèles d’IA du moment ?
La Chatbot Arena a recueilli l’avis de plus de 2 000 000 contributeurs pour établir son classement des modèles de langage.
Le principe est simple : après la présentation de deux réponses anonymes à un prompt donné, l’utilisateur vote pour la réponse qu’il juge la plus pertinente, cohérente ou créative.
Le système Elo ajuste alors les scores des modèles en fonction des victoires, défaites, et de la force présumée des adversaires rencontrés.
C’est un moyen objectif et le plus fiable de comparer les capacités des différents modèles.

La Chatbot Arena, c’est quoi ?
L’origine de la Chatbot Arena remonte à un projet étudiant de l’Université de Berkeley, appuyé par Hugging Face.
L’idée ?
Stimuler la recherche en IA générative à travers le développement de modèles de langage, l’élaboration d’interfaces utilisateur intuitives, et la compilation d’ensembles de données riches.
Cette initiative a mené à la création d’un espace unique : la Chatbot Arena, où les modèles de langage s’affrontent selon le système d’évaluation Elo.
Cet outil mesure les performances des modèles à partir des choix des utilisateurs entre deux réponses données à un prompt identique.
Comment vous pouvez participer ?

Pour ceux intéressés par l’évaluation des modèles de langage et souhaitant contribuer à ce classement dynamique, il suffit de vous rendre sur ce site : https://chat.lmsys.org/.
Vous y aurez l’occasion de comparer des modèles qui sont anonymisés, en jugeant de la qualité de leurs réponses à un prompt unique.
Ce processus participatif est ouvert à tous, permettant ainsi à la communauté d’influer directement sur le classement des modèles IA (qui change en temps réel).
La Chatbot Arena offre une plateforme unique pour évaluer objectivement les performances des modèles de langage, en se basant sur l’avis de la communauté.
Ce classement, mis à jour en temps réel, fournit un aperçu précieux et actualisé des avancées technologiques et de la compétitivité dans le domaine de l’IA générative.

Fondateur de LEPTIDIGITAL et SUPASST, je suis également consultant spécialisé en acquisition de leads B2B (SaaS). Passionné par le marketing digital, l’intelligence artificielle et le SEO. Avant de devenir indépendant, j’ai occupé des postes clés en tant que SEO Manager et responsable e-commerce pour plusieurs grandes entreprises (Altice Media, Infopro Digital, Voyage Privé et le Groupe ERAM). Sur le plan perso, je suis un curieux insatiable, également passionné par la photographie, le badminton et les voyages. Pour toute demande de partenariat, privilégiez LinkedIn ou email ([email protected]).
