
Accès rapide (Sommaire) :
Comment sont calculés les coûts des LLM ?
Le prix d’un LLM repose principalement sur :
- Le coût par million de tokens en entrée (ce que vous envoyez au modèle) ;
- Le coût par million de tokens en sortie (ce que le modèle génère en réponse) ;
- La taille du contexte (quantité d’informations mémorisées dans une requête) ;
- Les performances générales du modèle (rapidité, précision, capacités avancées).
Comparatif des prix des LLM les plus populaires :
Modèle | Fournisseur | Prix des tokens en entrée ($ / Millions) | Prix des tokens en sortie (output) ($ / Millions) | Licence |
---|---|---|---|---|
GPT-4o | OpenAI | 2,5 | 10 | Propriétaire |
Claude 3.5 Sonnet | Anthropic | 3 | 15 | Propriétaire |
Gemini 1.5 Pro | 2,5 | 10 | Propriétaire | |
Yi-Lightning | 01 AI | 0,14 | 0,14 | Propriétaire |
Athene-v2-Chat-72B | NexusFlow | 0,9 | 0,9 | NexusFlow |
GLM-4-Plus | Zhipu | 6,9 | 6,9 | Propriétaire |
GPT-4o Mini | OpenAI | 0,15 | 0,6 | Propriétaire |
Gemini 1.5 Flash | 0,075 | 0,3 | Propriétaire | |
Llama 3.1 405B | Meta | 3,5 | 3,5 | Llama 3.1 Community |
Qwen2.5 Max | Alibaba | 1,6 | 6,4 | Propriétaire |
Claude 3 Opus | Anthropic | 15 | 75 | Propriétaire |
Comparatif des LLM en fonction de leurs coûts vs performances :

Le même comparatif pour les modèles évalués sur des prompts en français :

Quels sont les modèles génériques les plus rentables ?
En analysant les prix, voici les modèles qui offrent le meilleur coût par token :
- ✅ Yi-Lightning (01 AI) : avec un coût de seulement 0,14 $ / M tokens en entrée et en sortie, c’est l’un des plus abordables.
- ✅ Gemini 1.5 Flash (Google) : à 0,075 $ / M tokens en entrée et 0,3 $ / M tokens en sortie, il est idéal pour des tâches nécessitant une grande quantité de texte généré.
- ✅ GPT-4o Mini (OpenAI) : à 0,15 $/M tokens en entrée et 0,6 $ / M tokens en sortie, il représente une alternative intéressante aux modèles haut de gamme.
- ✅ Athene-v2-Chat-72B (NexusFlow) : avec 0,9 $ / M tokens en entrée et sortie, il reste compétitif pour des besoins avancés.
- ❌ Claude 3 Opus (Anthropic) est en revanche l’un des plus chers (15 $ / M en entrée et 75 $ / M en sortie), mais offre une qualité de génération supérieure.
Quel LLM choisir selon votre budget ?
- Petit budget : Yi-Lightning ou Gemini 1.5 Flash.
- Équilibre coût / performance : GPT-4o Mini ou Athene-v2-Chat-72B.
- Performance maximale : Claude 3 Opus, GPT-4o, Gemini 2.0 ou GPT-4.5.
Selon votre cas d’usage, l’optimisation du choix de LLM peut représenter des économies significatives.
Pensez à tester plusieurs modèles pour trouver celui qui convient le mieux à vos besoins !

Fondateur de LEPTIDIGITAL et consultant spécialisé en acquisition de leads B2B (SaaS) et SEO. Passionné par le marketing digital, l’intelligence artificielle et le référencement naturel, il possède une solide expérience dans ces domaines. Au fil de sa carrière, il a occupé des postes clés en tant que SEO Manager et responsable e-commerce pour plusieurs grandes entreprises, dont Altice Media, Infopro Digital, Voyage Privé et le Groupe ERAM. Sur le plan personnel, c’est un curieux insatiable, également passionné par la photographie, le badminton et les voyages. Pour toute demande de partenariat, privilégiez une prise de contact via LinkedIn ou par email à [email protected].