OpenReplay Logo
12k
12k

Calculateur de coût d'API LLM

Estimez et comparez les coûts des API LLM entre GPT, Claude, Gemini et Llama. Collez une invite pour compter automatiquement les tokens ou saisissez les chiffres, puis voyez le coût par appel et à grande échelle.

Sur les modèles de raisonnement, comptez ici les tokens de réflexion — ils sont facturés comme des tokens de sortie.

Traité localement

Coût pour Claude Opus 4.8

$0.00
Coût d'entrée / appel
$0.00
Coût de sortie / appel
$0.00
Total / appel
$0.00
Total / 1 requête
$0.00
Pour 1 K requêtes
$0.00
Pour 1 M requêtes

Comparer tous les modèles

Prix mis à jour le June 2026
Modèle Entrée $/1M Sortie $/1M Coût / appel Coût / N req

List prices in USD per 1 million tokens, standard synchronous tier. Providers change pricing and ship new models often, so treat these as a starting point and confirm against the provider's pricing page before budgeting. See priceNote for context-length tiers, long-context surcharges, cache-hit rates, and thinking-mode differences. Chinese providers (DeepSeek, Moonshot/Kimi, Qwen, GLM) are shown at their international USD rates. Token counts are exact for OpenAI (tiktoken); all other providers are approximate (no official public client-side tokenizer). Note: Anthropic models 4.7+ (Opus 4.8, Fable 5) use a newer tokenizer that yields ~30% more tokens than 4.5/4.6 — reflected in charsPerToken.

À propos de cet outil

Chaque API LLM facture au token, avec des tarifs distincts pour l'entrée (l'invite) et la sortie (la complétion), de sorte que le coût d'une fonctionnalité dépend du nombre de tokens qui circulent dans chaque sens et de la fréquence à laquelle vous appelez le modèle. Ce calculateur transforme ces chiffres en un coût par appel et les projette sur des milliers ou des millions de requêtes, puis aligne chaque modèle côte à côte pour que vous puissiez voir ce que la même charge de travail coûte sur chacun.

Saisissez directement les tokens d'entrée et de sortie, ou collez votre invite pour compter ses tokens avec le tokeniseur partagé — exact pour OpenAI, estimé pour les autres fournisseurs. Les prix sont des tarifs catalogue par million de tokens, et la date de leur dernière mise à jour est indiquée au-dessus du tableau de comparaison ; comme les fournisseurs modifient souvent leurs tarifs et lancent de nouveaux modèles, considérez les totaux comme une estimation bien documentée et confirmez-les auprès du fournisseur avant d'engager un budget.

Les prix catalogue peuvent exclure les remises sur volume, la tarification des entrées mises en cache et les paliers de traitement par lots. Tout est calculé localement dans votre navigateur.

Questions fréquentes

Comment le coût est-il calculé ?

Les tokens d'entrée multipliés par le prix d'entrée du modèle, plus les tokens de sortie multipliés par son prix de sortie, chacun calculé au prorata du tarif catalogue par million de tokens. Le total par appel est la somme, et les projections multiplient simplement ce total par votre volume de requêtes.

Pourquoi l'entrée et la sortie sont-elles tarifées différemment ?

Générer une sortie demande plus de puissance de calcul que lire une entrée, c'est pourquoi la plupart des fournisseurs facturent davantage — souvent plusieurs fois plus — par token de sortie que par token d'entrée. C'est pour cela qu'un modèle qui renvoie de longues réponses peut coûter bien plus que ne le laisse penser son seul prix d'entrée.

Ces prix sont-ils à jour ?

Ils reflètent les prix catalogue publiés à la date indiquée au-dessus du tableau, stockés en un seul endroit que nous mettons à jour périodiquement. Les fournisseurs ajustent fréquemment leurs tarifs et publient de nouveaux modèles, et les remises, les tarifs d'entrées mises en cache et les paliers de traitement par lots ne sont pas inclus, donc vérifiez auprès du fournisseur avant de vous fier à un chiffre.

Et la tarification mise en cache ou par lots ?

De nombreux fournisseurs proposent des tarifs moins chers pour les préfixes d'invite mis en cache ou les traitements par lots asynchrones. Ce calculateur utilise les tarifs standard en temps réel, donc si vous utilisez ces paliers, votre coût réel sera inférieur à celui affiché.