Verificador de ventana de contexto

Modelo

Reservar para la respuesta (tokens de salida previstos)

Tu prompt Estimación

Procesado localmente

0 / 1,000,000 tokens

0% de la ventana utilizada

Tokens usados

Reservados para la respuesta

1,000,000

Tokens restantes

Referencia de ventanas de contexto Actualizado el June 2026

Modelo	Proveedor	Ventana de contexto
GPT-5.5	OpenAI	~1.1M tokens
GPT-5.4	OpenAI	~1.1M tokens
Gemini 3.5 Flash	Google	~1M tokens
Gemini 3.1 Pro (Preview)	Google	~1M tokens
Gemini 3.1 Flash-Lite	Google	~1M tokens
Gemini 3 Flash (Preview)	Google	~1M tokens
Gemini 2.5 Pro	Google	~1M tokens
Gemini 2.5 Flash	Google	~1M tokens
Gemini 2.5 Flash-Lite	Google	~1M tokens
GPT-4.1	OpenAI	~1M tokens
GPT-4.1 mini	OpenAI	~1M tokens
GPT-4.1 nano	OpenAI	~1M tokens
Claude Opus 4.8	Anthropic	~1M tokens
Claude Sonnet 4.6	Anthropic	~1M tokens
Claude Fable 5	Anthropic	~1M tokens
DeepSeek-V4-Flash	DeepSeek	~1M tokens
DeepSeek-V4-Pro	DeepSeek	~1M tokens
Qwen3.5-Plus	Alibaba	~1M tokens
Qwen-Plus	Alibaba	~1M tokens
Qwen3.5-Flash	Alibaba	~1M tokens
Qwen-Flash	Alibaba	~1M tokens
GLM-5.2	Zhipu AI	~1M tokens
GPT-5.4 mini	OpenAI	400,000 tokens
GPT-5.4 nano	OpenAI	400,000 tokens
GPT-5	OpenAI	400,000 tokens
GPT-5 mini	OpenAI	400,000 tokens
GPT-5 nano	OpenAI	400,000 tokens
Kimi K2.7 Code	Moonshot AI	262,144 tokens
Kimi K2.6	Moonshot AI	262,144 tokens
Kimi K2.5	Moonshot AI	262,144 tokens
Qwen3-Max	Alibaba	262,144 tokens
o3	OpenAI	200,000 tokens
o4-mini	OpenAI	200,000 tokens
Claude Opus 4.5	Anthropic	200,000 tokens
Claude Sonnet 4.5	Anthropic	200,000 tokens
Claude Haiku 4.5	Anthropic	200,000 tokens
GLM-5.1	Zhipu AI	200,000 tokens
GLM-5	Zhipu AI	200,000 tokens
GLM-4.7	Zhipu AI	200,000 tokens
GLM-4.7-FlashX	Zhipu AI	200,000 tokens
GLM-4.7-Flash	Zhipu AI	200,000 tokens
GLM-4.6	Zhipu AI	200,000 tokens
Moonshot V1 128k	Moonshot AI	131,072 tokens
QwQ-Plus	Alibaba	131,072 tokens
GLM-4.5	Zhipu AI	131,072 tokens
GLM-4.5-Air	Zhipu AI	131,072 tokens
Llama 3.3 70B	Meta	131,072 tokens
Llama 3.1 405B	Meta	131,072 tokens
Llama 3.1 8B	Meta	131,072 tokens
GPT-4o	OpenAI	128,000 tokens
GPT-4o mini	OpenAI	128,000 tokens
Moonshot V1 32k	Moonshot AI	32,768 tokens
GPT-3.5 Turbo	OpenAI	16,385 tokens
Moonshot V1 8k	Moonshot AI	8,192 tokens

Acerca de esta herramienta

La ventana de contexto de un modelo es el número máximo de tokens que puede tener en cuenta a la vez — el prompt y la completación combinados. Si la superas, la solicitud se rechaza o se trunca silenciosamente, descartando el comienzo de tu prompt. Esta herramienta cuenta tu texto frente al límite del modelo seleccionado y muestra el resultado como una barra de progreso con los tokens usados, el porcentaje de la ventana consumido y los tokens restantes para la respuesta.

Las ventanas de contexto van desde unos pocos miles de tokens en los modelos más antiguos hasta más de un millón en los más recientes. Recuerda que la ventana es compartida: cada token gastado en el prompt es uno menos disponible para la respuesta, así que deja margen para la salida que esperas. Los recuentos de OpenAI son exactos gracias a tiktoken; los de otros proveedores son estimaciones basadas en caracteres.

La ventana se comparte entre la entrada y la salida — reserva espacio para la respuesta, no solo para el prompt.

Preguntas frecuentes

¿Qué es una ventana de contexto?

Es el número total de tokens que un modelo puede mantener en memoria de trabajo para una sola solicitud, abarcando tanto tu prompt como la respuesta generada. Piénsala como la capacidad de atención a corto plazo del modelo, medida en tokens.

¿Qué ocurre si la supero?

Según la API, la solicitud falla con un error o se trunca — normalmente se descartan los tokens más antiguos — lo que puede eliminar discretamente instrucciones colocadas al inicio de tu prompt. Lo mejor es mantenerse cómodamente por debajo del límite.

¿El prompt y la respuesta comparten la ventana?

Sí. Si un modelo dispone de una ventana de 128K y tu prompt es de 120K tokens, solo quedan unos 8K para la respuesta. Reserva siempre espacio para la salida esperada.

¿Qué modelos tienen las mayores ventanas de contexto?

Varios modelos recientes de OpenAI y Google ofrecen alrededor de un millón de tokens, mientras que muchos modelos en producción se sitúan entre 128K y 200K. La tabla de referencia de esta herramienta indica el límite de cada modelo.

Acerca de esta herramienta

Preguntas frecuentes

Herramientas relacionadas