En los modelos de razonamiento, cuenta aquí los tokens de pensamiento — se facturan como tokens de salida.
Los tokens contados rellenan el campo Tokens de entrada y se vuelven a contar cuando cambias de modelo.
Costo para Claude Opus 4.8
Comparar todos los modelos
Precios actualizados el June 2026| Modelo | Entrada $/1M | Salida $/1M | Costo / llamada | Costo / N sol. |
|---|
List prices in USD per 1 million tokens, standard synchronous tier. Providers change pricing and ship new models often, so treat these as a starting point and confirm against the provider's pricing page before budgeting. See priceNote for context-length tiers, long-context surcharges, cache-hit rates, and thinking-mode differences. Chinese providers (DeepSeek, Moonshot/Kimi, Qwen, GLM) are shown at their international USD rates. Token counts are exact for OpenAI (tiktoken); all other providers are approximate (no official public client-side tokenizer). Note: Anthropic models 4.7+ (Opus 4.8, Fable 5) use a newer tokenizer that yields ~30% more tokens than 4.5/4.6 — reflected in charsPerToken.
Acerca de esta herramienta
Cada API de LLM cobra por token, con tarifas separadas para la entrada (el prompt) y la salida (la finalización), de modo que el coste de una función depende de cuántos tokens fluyen en cada dirección y de la frecuencia con la que llamas al modelo. Esta calculadora convierte esas cifras en un coste por llamada y las proyecta sobre miles o millones de solicitudes, y luego alinea cada modelo lado a lado para que puedas ver lo que cuesta la misma carga de trabajo en cada uno.
Introduce directamente los tokens de entrada y de salida, o pega tu prompt para contar sus tokens con el tokenizador compartido — exacto para OpenAI, estimado para otros proveedores. Los precios son tarifas de lista por millón de tokens, y la fecha de su última actualización se muestra sobre la tabla de comparación; como los proveedores cambian los precios y lanzan nuevos modelos con frecuencia, trata los totales como una estimación bien fundamentada y confírmalos con el proveedor antes de comprometer un presupuesto.
Los precios de lista pueden excluir los descuentos por volumen, la tarificación de entradas en caché y los niveles de procesamiento por lotes. Todo se calcula localmente en tu navegador.
Preguntas frecuentes
¿Cómo se calcula el coste?
Los tokens de entrada por el precio de entrada del modelo, más los tokens de salida por su precio de salida, cada uno prorrateado a partir de la tarifa de lista por millón de tokens. El total por llamada es la suma, y las proyecciones simplemente lo multiplican por tu volumen de solicitudes.
¿Por qué la entrada y la salida tienen precios diferentes?
Generar la salida exige más cómputo que leer la entrada, así que la mayoría de los proveedores cobran más — a menudo varias veces más — por token de salida que por token de entrada. Por eso un modelo que devuelve respuestas largas puede costar mucho más de lo que sugiere su precio de entrada por sí solo.
¿Están actualizados estos precios?
Reflejan los precios de lista publicados a la fecha indicada sobre la tabla, almacenados en un único lugar que actualizamos periódicamente. Los proveedores ajustan los precios y lanzan nuevos modelos con frecuencia, y los descuentos, las tarifas de entradas en caché y los niveles de procesamiento por lotes no se incluyen, así que verifica con el proveedor antes de fiarte de una cifra.
¿Y la tarificación en caché o por lotes?
Muchos proveedores ofrecen tarifas más baratas para los prefijos de prompt en caché o los trabajos por lotes asíncronos. Esta calculadora usa las tarifas estándar en tiempo real, así que si utilizas esos niveles tu coste real será inferior al mostrado.