OpenReplay Logo
12k
12k

Verificador de ventana de contexto

Comprueba si tu prompt cabe en la ventana de contexto de un modelo. Pega texto, elige un modelo y ve los tokens usados, los tokens restantes y lo cerca que estás del límite.

Estimación
Procesado localmente
0 / 1,000,000 tokens
0% de la ventana utilizada
0
Tokens usados
0
Reservados para la respuesta
1,000,000
Tokens restantes
Referencia de ventanas de contexto Actualizado el June 2026
Modelo Proveedor Ventana de contexto
GPT-5.5 OpenAI ~1.1M tokens
GPT-5.4 OpenAI ~1.1M tokens
Gemini 3.5 Flash Google ~1M tokens
Gemini 3.1 Pro (Preview) Google ~1M tokens
Gemini 3.1 Flash-Lite Google ~1M tokens
Gemini 3 Flash (Preview) Google ~1M tokens
Gemini 2.5 Pro Google ~1M tokens
Gemini 2.5 Flash Google ~1M tokens
Gemini 2.5 Flash-Lite Google ~1M tokens
GPT-4.1 OpenAI ~1M tokens
GPT-4.1 mini OpenAI ~1M tokens
GPT-4.1 nano OpenAI ~1M tokens
Claude Opus 4.8 Anthropic ~1M tokens
Claude Sonnet 4.6 Anthropic ~1M tokens
Claude Fable 5 Anthropic ~1M tokens
DeepSeek-V4-Flash DeepSeek ~1M tokens
DeepSeek-V4-Pro DeepSeek ~1M tokens
Qwen3.5-Plus Alibaba ~1M tokens
Qwen-Plus Alibaba ~1M tokens
Qwen3.5-Flash Alibaba ~1M tokens
Qwen-Flash Alibaba ~1M tokens
GLM-5.2 Zhipu AI ~1M tokens
GPT-5.4 mini OpenAI 400,000 tokens
GPT-5.4 nano OpenAI 400,000 tokens
GPT-5 OpenAI 400,000 tokens
GPT-5 mini OpenAI 400,000 tokens
GPT-5 nano OpenAI 400,000 tokens
Kimi K2.7 Code Moonshot AI 262,144 tokens
Kimi K2.6 Moonshot AI 262,144 tokens
Kimi K2.5 Moonshot AI 262,144 tokens
Qwen3-Max Alibaba 262,144 tokens
o3 OpenAI 200,000 tokens
o4-mini OpenAI 200,000 tokens
Claude Opus 4.5 Anthropic 200,000 tokens
Claude Sonnet 4.5 Anthropic 200,000 tokens
Claude Haiku 4.5 Anthropic 200,000 tokens
GLM-5.1 Zhipu AI 200,000 tokens
GLM-5 Zhipu AI 200,000 tokens
GLM-4.7 Zhipu AI 200,000 tokens
GLM-4.7-FlashX Zhipu AI 200,000 tokens
GLM-4.7-Flash Zhipu AI 200,000 tokens
GLM-4.6 Zhipu AI 200,000 tokens
Moonshot V1 128k Moonshot AI 131,072 tokens
QwQ-Plus Alibaba 131,072 tokens
GLM-4.5 Zhipu AI 131,072 tokens
GLM-4.5-Air Zhipu AI 131,072 tokens
Llama 3.3 70B Meta 131,072 tokens
Llama 3.1 405B Meta 131,072 tokens
Llama 3.1 8B Meta 131,072 tokens
GPT-4o OpenAI 128,000 tokens
GPT-4o mini OpenAI 128,000 tokens
Moonshot V1 32k Moonshot AI 32,768 tokens
GPT-3.5 Turbo OpenAI 16,385 tokens
Moonshot V1 8k Moonshot AI 8,192 tokens

Acerca de esta herramienta

La ventana de contexto de un modelo es el número máximo de tokens que puede tener en cuenta a la vez — el prompt y la completación combinados. Si la superas, la solicitud se rechaza o se trunca silenciosamente, descartando el comienzo de tu prompt. Esta herramienta cuenta tu texto frente al límite del modelo seleccionado y muestra el resultado como una barra de progreso con los tokens usados, el porcentaje de la ventana consumido y los tokens restantes para la respuesta.

Las ventanas de contexto van desde unos pocos miles de tokens en los modelos más antiguos hasta más de un millón en los más recientes. Recuerda que la ventana es compartida: cada token gastado en el prompt es uno menos disponible para la respuesta, así que deja margen para la salida que esperas. Los recuentos de OpenAI son exactos gracias a tiktoken; los de otros proveedores son estimaciones basadas en caracteres.

La ventana se comparte entre la entrada y la salida — reserva espacio para la respuesta, no solo para el prompt.

Preguntas frecuentes

¿Qué es una ventana de contexto?

Es el número total de tokens que un modelo puede mantener en memoria de trabajo para una sola solicitud, abarcando tanto tu prompt como la respuesta generada. Piénsala como la capacidad de atención a corto plazo del modelo, medida en tokens.

¿Qué ocurre si la supero?

Según la API, la solicitud falla con un error o se trunca — normalmente se descartan los tokens más antiguos — lo que puede eliminar discretamente instrucciones colocadas al inicio de tu prompt. Lo mejor es mantenerse cómodamente por debajo del límite.

¿El prompt y la respuesta comparten la ventana?

Sí. Si un modelo dispone de una ventana de 128K y tu prompt es de 120K tokens, solo quedan unos 8K para la respuesta. Reserva siempre espacio para la salida esperada.

¿Qué modelos tienen las mayores ventanas de contexto?

Varios modelos recientes de OpenAI y Google ofrecen alrededor de un millón de tokens, mientras que muchos modelos en producción se sitúan entre 128K y 200K. La tabla de referencia de esta herramienta indica el límite de cada modelo.