| Modelo | Proveedor | Ventana de contexto |
|---|---|---|
| GPT-5.5 | OpenAI | ~1.1M tokens |
| GPT-5.4 | OpenAI | ~1.1M tokens |
| Gemini 3.5 Flash | ~1M tokens | |
| Gemini 3.1 Pro (Preview) | ~1M tokens | |
| Gemini 3.1 Flash-Lite | ~1M tokens | |
| Gemini 3 Flash (Preview) | ~1M tokens | |
| Gemini 2.5 Pro | ~1M tokens | |
| Gemini 2.5 Flash | ~1M tokens | |
| Gemini 2.5 Flash-Lite | ~1M tokens | |
| GPT-4.1 | OpenAI | ~1M tokens |
| GPT-4.1 mini | OpenAI | ~1M tokens |
| GPT-4.1 nano | OpenAI | ~1M tokens |
| Claude Opus 4.8 | Anthropic | ~1M tokens |
| Claude Sonnet 4.6 | Anthropic | ~1M tokens |
| Claude Fable 5 | Anthropic | ~1M tokens |
| DeepSeek-V4-Flash | DeepSeek | ~1M tokens |
| DeepSeek-V4-Pro | DeepSeek | ~1M tokens |
| Qwen3.5-Plus | Alibaba | ~1M tokens |
| Qwen-Plus | Alibaba | ~1M tokens |
| Qwen3.5-Flash | Alibaba | ~1M tokens |
| Qwen-Flash | Alibaba | ~1M tokens |
| GLM-5.2 | Zhipu AI | ~1M tokens |
| GPT-5.4 mini | OpenAI | 400,000 tokens |
| GPT-5.4 nano | OpenAI | 400,000 tokens |
| GPT-5 | OpenAI | 400,000 tokens |
| GPT-5 mini | OpenAI | 400,000 tokens |
| GPT-5 nano | OpenAI | 400,000 tokens |
| Kimi K2.7 Code | Moonshot AI | 262,144 tokens |
| Kimi K2.6 | Moonshot AI | 262,144 tokens |
| Kimi K2.5 | Moonshot AI | 262,144 tokens |
| Qwen3-Max | Alibaba | 262,144 tokens |
| o3 | OpenAI | 200,000 tokens |
| o4-mini | OpenAI | 200,000 tokens |
| Claude Opus 4.5 | Anthropic | 200,000 tokens |
| Claude Sonnet 4.5 | Anthropic | 200,000 tokens |
| Claude Haiku 4.5 | Anthropic | 200,000 tokens |
| GLM-5.1 | Zhipu AI | 200,000 tokens |
| GLM-5 | Zhipu AI | 200,000 tokens |
| GLM-4.7 | Zhipu AI | 200,000 tokens |
| GLM-4.7-FlashX | Zhipu AI | 200,000 tokens |
| GLM-4.7-Flash | Zhipu AI | 200,000 tokens |
| GLM-4.6 | Zhipu AI | 200,000 tokens |
| Moonshot V1 128k | Moonshot AI | 131,072 tokens |
| QwQ-Plus | Alibaba | 131,072 tokens |
| GLM-4.5 | Zhipu AI | 131,072 tokens |
| GLM-4.5-Air | Zhipu AI | 131,072 tokens |
| Llama 3.3 70B | Meta | 131,072 tokens |
| Llama 3.1 405B | Meta | 131,072 tokens |
| Llama 3.1 8B | Meta | 131,072 tokens |
| GPT-4o | OpenAI | 128,000 tokens |
| GPT-4o mini | OpenAI | 128,000 tokens |
| Moonshot V1 32k | Moonshot AI | 32,768 tokens |
| GPT-3.5 Turbo | OpenAI | 16,385 tokens |
| Moonshot V1 8k | Moonshot AI | 8,192 tokens |
Acerca de esta herramienta
La ventana de contexto de un modelo es el número máximo de tokens que puede tener en cuenta a la vez — el prompt y la completación combinados. Si la superas, la solicitud se rechaza o se trunca silenciosamente, descartando el comienzo de tu prompt. Esta herramienta cuenta tu texto frente al límite del modelo seleccionado y muestra el resultado como una barra de progreso con los tokens usados, el porcentaje de la ventana consumido y los tokens restantes para la respuesta.
Las ventanas de contexto van desde unos pocos miles de tokens en los modelos más antiguos hasta más de un millón en los más recientes. Recuerda que la ventana es compartida: cada token gastado en el prompt es uno menos disponible para la respuesta, así que deja margen para la salida que esperas. Los recuentos de OpenAI son exactos gracias a tiktoken; los de otros proveedores son estimaciones basadas en caracteres.
La ventana se comparte entre la entrada y la salida — reserva espacio para la respuesta, no solo para el prompt.
Preguntas frecuentes
¿Qué es una ventana de contexto?
Es el número total de tokens que un modelo puede mantener en memoria de trabajo para una sola solicitud, abarcando tanto tu prompt como la respuesta generada. Piénsala como la capacidad de atención a corto plazo del modelo, medida en tokens.
¿Qué ocurre si la supero?
Según la API, la solicitud falla con un error o se trunca — normalmente se descartan los tokens más antiguos — lo que puede eliminar discretamente instrucciones colocadas al inicio de tu prompt. Lo mejor es mantenerse cómodamente por debajo del límite.
¿El prompt y la respuesta comparten la ventana?
Sí. Si un modelo dispone de una ventana de 128K y tu prompt es de 120K tokens, solo quedan unos 8K para la respuesta. Reserva siempre espacio para la salida esperada.
¿Qué modelos tienen las mayores ventanas de contexto?
Varios modelos recientes de OpenAI y Google ofrecen alrededor de un millón de tokens, mientras que muchos modelos en producción se sitúan entre 128K y 200K. La tabla de referencia de esta herramienta indica el límite de cada modelo.