NEWS #Digitale : envie de recevoir nos meilleurs articles ?  Inscription → 

Voici les 16 modèles d’IA (LLM) les plus performants en 2024 (selon 500 000 testeurs)

Saviez-vous que tous les modèles d’IA générative du marché étaient actuellement testées en temps réel par des centaines de milliers d’internautes dans une « Chatbot Arena » ? Cette compétition, à l’échelle internationale, est orchestrée par la Large Model Systems Organization en partenariat avec Hugging Face. À ce jour, plus de 500 000 tests anonymes ont déjà et réalisés par des volontaires pour aboutir à un classement totalement impartial des modèles d’IA les plus performants. Alors, quels sont les meilleurs modèles d’IA en 2024 ? Quels sont les challengers moins connus qui s’attaquent aux poids lourds du marché ? Comment pouvez-vous aussi participer à cette compétition ? Découvrons cela ensemble.
intelligence artificielle IA

Et les 10 meilleurs LLM du moment sont…

Sur la base de plus de 500 000 tests anonymes réalisés par des internautes bénévoles, LMSYS, en partenariat avec Hugging Face, nous révèle les meilleurs modèles IA du marché (selon les utilisateurs eux-même).

Voici un aperçu du top 10 actuel :

  1. Claude-3 Opus : 1253 (score Elo)
  2. GPT-4 1106 : 1251
  3. GPT-4 0125 : 1248
  4. Gemini Pro : 1203
  5. Claude 3 Sonnet : 1198
  6. GPT-4 0314 : 1185
  7. Claude 3 Haiku : 1179
  8. GPT-4 0613 : 1158
  9. Mistral Large 2402 : 1157
  10. Qwen1 5-72B Chat : 1148

Cette compétition interactive a révélé quelques surprises, notamment avec Claude-3 Opus d’Anthropic qui se hisse pour l’instant en tête du classement, devançant les variantes de GPT-4, pourtant très réputées.

Quels sont les 16 modèles d’IA les plus performants selon 500 000 utilisateurs ?

PositionModèleEntrepriseLicenseEntrainement jusqu’en
1Claude 3 OpusAnthropicProprietary2023/8
1GPT-4-1106-previewOpenAIProprietary2023/4
1GPT-4-0125-previewOpenAIProprietary2023/12
4Bard (Gemini Pro)GoogleProprietaryOnline
4Claude 3 SonnetAnthropicProprietary2023/8
6GPT-4-0314OpenAIProprietary2021/9
7Claude 3 HaikuAnthropicProprietary2023/8
8GPT-4-0613OpenAIProprietary2021/9
8Mistral-Large-2402MistralProprietaryUnknown
9Qwen1.5-72B-ChatAlibabaQianwen LICENSE2024/2
10Claude-1AnthropicProprietaryUnknown
10Mistral MediumMistralProprietaryUnknown
10Command RCohereCC-BY-NC-4.02024/3
14Gemini Pro (Dev API)GoogleProprietary2023/4
14Claude-2.0AnthropicProprietaryUnknown
14Mistral-NextMistralProprietaryUnknown
Classement des meilleurs modèles d’IA mis à jour le 01 avril 2024

Comment fonctionne le classement des meilleurs modèles d’IA du moment ?

La Chatbot Arena a recueilli l’avis de plus de 500 000 contributeurs pour établir son classement des modèles de langage.

Le principe est simple : après la présentation de deux réponses anonymes à un prompt donné, l’utilisateur vote pour la réponse qu’il juge la plus pertinente, cohérente ou créative.

Le système Elo ajuste alors les scores des modèles en fonction des victoires, défaites, et de la force présumée des adversaires rencontrés.

C’est un moyen objectif et le plus fiable de comparer les capacités des différents modèles.

Aperçu du classement des meilleurs modèles IA (les plus performants selon leurs utilisateurs)
Aperçu du classement des meilleurs modèles IA (les plus performants selon leurs utilisateurs)

La Chatbot Arena, c’est quoi ?

L’origine de la Chatbot Arena remonte à un projet étudiant de l’Université de Berkeley, appuyé par Hugging Face.

L’idée ?

Stimuler la recherche en IA générative à travers le développement de modèles de langage, l’élaboration d’interfaces utilisateur intuitives, et la compilation d’ensembles de données riches.

Cette initiative a mené à la création d’un espace unique : la Chatbot Arena, où les modèles de langage s’affrontent selon le système d’évaluation Elo.

Cet outil mesure les performances des modèles à partir des choix des utilisateurs entre deux réponses données à un prompt identique.

Comment vous pouvez participer ?

Aperçu de la chatbot arena
Aperçu de la chatbot arena

Pour ceux intéressés par l’évaluation des modèles de langage et souhaitant contribuer à ce classement dynamique, il suffit de vous rendre sur ce site : https://chat.lmsys.org/.

Vous y aurez l’occasion de comparer des modèles qui sont anonymisés, en jugeant de la qualité de leurs réponses à un prompt unique.

Ce processus participatif est ouvert à tous, permettant ainsi à la communauté d’influer directement sur le classement des modèles IA (qui change en temps réel).

La Chatbot Arena offre une plateforme unique pour évaluer objectivement les performances des modèles de langage, en se basant sur l’avis de la communauté.

Ce classement, mis à jour en temps réel, fournit un aperçu précieux et actualisé des avancées technologiques et de la compétitivité dans le domaine de l’IA générative.

Avant de se quitter…

Si cet article sur le classement des modèles d’IA les plus performants vous a plu, n’hésitez pas à le partager sur les réseaux sociaux, à vous abonner à notre newsletter digitale et/ou à nous suivre sur Google Actualités pour recevoir nos prochains articles.

Vous pouvez également suivre nos meilleurs articles via notre flux RSS : https://www.leptidigital.fr/tag/newsletter-digitale/feed/ (il vous suffit de l’insérer dans votre lecteur de flux RSS préféré (ex : Feedly)).

Nous sommes aussi actifs sur LinkedIn, X, Facebook, Threads et YouTube. On s’y retrouve ?

Un avis ? post

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *