OpenReplay Logo
12k
12k

Contador de tokens LLM

Cuenta los tokens para GPT, Claude, Gemini, DeepSeek, Qwen, Llama y más, y observa exactamente cómo se divide tu texto — recuentos tiktoken exactos para OpenAI, estimaciones etiquetadas en el resto, todo en tu navegador.

Exacto · tiktoken o200k_base
Procesado localmente
0
Tokens
0
Caracteres
0
Palabras
0
Tokens / palabra
Desglose de tokens
Las fichas de tokens aparecen aquí a medida que escribes.

Acerca de esta herramienta

Los grandes modelos de lenguaje no leen caracteres ni palabras — leen tokens, los fragmentos de subpalabras en los que un tokenizador divide el texto. El recuento de tokens determina tanto los límites de contexto como la facturación de la API, de modo que conocer cuántos tokens usa un prompt marca la diferencia entre una solicitud que cabe y una que se trunca o resulta inesperadamente cara. Este contador muestra un recuento de tokens en directo junto al recuento de caracteres y palabras, además de una vista coloreada de la segmentación para que puedas ver exactamente dónde caen los límites.

Elige un modelo para cambiar de tokenizador. Los modelos de OpenAI usan tiktoken — o200k_base para GPT-5.x, GPT-4o y GPT-4.1, cl100k_base para GPT-3.5 — y producen recuentos exactos, idénticos a los de la API. Todos los demás proveedores (Anthropic, Google, DeepSeek, Alibaba Qwen, Moonshot Kimi, Zhipu GLM, Meta Llama) no tienen un tokenizador oficial del lado del navegador, así que esos recuentos son estimaciones basadas en caracteres: útiles para la planificación, pero verifícalas frente al propio informe de uso del proveedor antes de fiarte de ellas para la facturación.

Tu texto se tokeniza por completo en tu navegador — nada se sube, y las tablas tiktoken se cargan bajo demanda la primera vez que cuentas.

Preguntas frecuentes

¿Qué es un token?

Un token es la unidad que procesa un modelo de lenguaje: una palabra común suele ser un solo token, mientras que las palabras más largas o raras se dividen en varios. Como regla aproximada, un token equivale a unos cuatro caracteres del inglés, o a aproximadamente tres cuartos de palabra — pero la única cifra exacta es la que produce el propio tokenizador del modelo.

¿Son exactos los recuentos?

Para los modelos de OpenAI, sí — esta herramienta ejecuta las mismas codificaciones tiktoken (o200k_base y cl100k_base) que usa la API. Para todos los demás proveedores — Anthropic, Google, DeepSeek, Qwen, Kimi, GLM, Llama — no existe un tokenizador público oficial del lado del cliente, así que esos recuentos son estimaciones basadas en caracteres y están claramente etiquetados como estimaciones (una nota incluso señala que la división coloreada es una aproximación de OpenAI).

¿Por qué el mismo texto usa un número de tokens distinto según el modelo?

Cada familia de modelos se entrena con su propio tokenizador y vocabulario, de modo que un texto idéntico se divide de forma diferente. Los vocabularios más recientes como o200k_base por lo general condensan el inglés común en menos tokens que los anteriores, y el código o las escrituras no latinas pueden variar notablemente de una familia a otra.

¿Maneja emojis y otros idiomas?

Sí. Los recuentos cubren toda la entrada, incluidos emojis, caracteres CJK y letras acentuadas. En la vista coloreada, un carácter que un modelo codifica en varios tokens se fusiona en una sola etiqueta legible, mientras que el recuento sigue reflejando cada token subyacente.