| Modelo | Provedor | Janela de contexto |
|---|---|---|
| GPT-5.5 | OpenAI | ~1.1M tokens |
| GPT-5.4 | OpenAI | ~1.1M tokens |
| Gemini 3.5 Flash | ~1M tokens | |
| Gemini 3.1 Pro (Preview) | ~1M tokens | |
| Gemini 3.1 Flash-Lite | ~1M tokens | |
| Gemini 3 Flash (Preview) | ~1M tokens | |
| Gemini 2.5 Pro | ~1M tokens | |
| Gemini 2.5 Flash | ~1M tokens | |
| Gemini 2.5 Flash-Lite | ~1M tokens | |
| GPT-4.1 | OpenAI | ~1M tokens |
| GPT-4.1 mini | OpenAI | ~1M tokens |
| GPT-4.1 nano | OpenAI | ~1M tokens |
| Claude Opus 4.8 | Anthropic | ~1M tokens |
| Claude Sonnet 4.6 | Anthropic | ~1M tokens |
| Claude Fable 5 | Anthropic | ~1M tokens |
| DeepSeek-V4-Flash | DeepSeek | ~1M tokens |
| DeepSeek-V4-Pro | DeepSeek | ~1M tokens |
| Qwen3.5-Plus | Alibaba | ~1M tokens |
| Qwen-Plus | Alibaba | ~1M tokens |
| Qwen3.5-Flash | Alibaba | ~1M tokens |
| Qwen-Flash | Alibaba | ~1M tokens |
| GLM-5.2 | Zhipu AI | ~1M tokens |
| GPT-5.4 mini | OpenAI | 400,000 tokens |
| GPT-5.4 nano | OpenAI | 400,000 tokens |
| GPT-5 | OpenAI | 400,000 tokens |
| GPT-5 mini | OpenAI | 400,000 tokens |
| GPT-5 nano | OpenAI | 400,000 tokens |
| Kimi K2.7 Code | Moonshot AI | 262,144 tokens |
| Kimi K2.6 | Moonshot AI | 262,144 tokens |
| Kimi K2.5 | Moonshot AI | 262,144 tokens |
| Qwen3-Max | Alibaba | 262,144 tokens |
| o3 | OpenAI | 200,000 tokens |
| o4-mini | OpenAI | 200,000 tokens |
| Claude Opus 4.5 | Anthropic | 200,000 tokens |
| Claude Sonnet 4.5 | Anthropic | 200,000 tokens |
| Claude Haiku 4.5 | Anthropic | 200,000 tokens |
| GLM-5.1 | Zhipu AI | 200,000 tokens |
| GLM-5 | Zhipu AI | 200,000 tokens |
| GLM-4.7 | Zhipu AI | 200,000 tokens |
| GLM-4.7-FlashX | Zhipu AI | 200,000 tokens |
| GLM-4.7-Flash | Zhipu AI | 200,000 tokens |
| GLM-4.6 | Zhipu AI | 200,000 tokens |
| Moonshot V1 128k | Moonshot AI | 131,072 tokens |
| QwQ-Plus | Alibaba | 131,072 tokens |
| GLM-4.5 | Zhipu AI | 131,072 tokens |
| GLM-4.5-Air | Zhipu AI | 131,072 tokens |
| Llama 3.3 70B | Meta | 131,072 tokens |
| Llama 3.1 405B | Meta | 131,072 tokens |
| Llama 3.1 8B | Meta | 131,072 tokens |
| GPT-4o | OpenAI | 128,000 tokens |
| GPT-4o mini | OpenAI | 128,000 tokens |
| Moonshot V1 32k | Moonshot AI | 32,768 tokens |
| GPT-3.5 Turbo | OpenAI | 16,385 tokens |
| Moonshot V1 8k | Moonshot AI | 8,192 tokens |
Sobre esta ferramenta
A janela de contexto de um modelo é o número máximo de tokens que ele pode considerar de uma só vez — o prompt e a completação somados. Se você a ultrapassar, a requisição é rejeitada ou silenciosamente truncada, descartando o início do seu prompt. Esta ferramenta conta o seu texto em relação ao limite do modelo selecionado e mostra o resultado como uma barra de progresso com os tokens usados, a porcentagem da janela consumida e os tokens restantes para a resposta.
As janelas de contexto vão de alguns milhares de tokens nos modelos mais antigos a mais de um milhão nos mais recentes. Lembre-se de que a janela é compartilhada: cada token gasto no prompt é um token a menos disponível para a resposta, então deixe folga para a saída que você espera. As contagens da OpenAI são exatas graças ao tiktoken; as de outros provedores são estimativas baseadas no número de caracteres.
A janela é compartilhada entre entrada e saída — reserve espaço para a resposta, não apenas para o prompt.
Perguntas frequentes
O que é uma janela de contexto?
É o número total de tokens que um modelo consegue manter na memória de trabalho para uma única requisição, cobrindo tanto o seu prompt quanto a resposta gerada. Pense nela como a capacidade de atenção de curto prazo do modelo, medida em tokens.
O que acontece se eu ultrapassá-la?
Dependendo da API, a requisição falha com um erro ou é truncada — geralmente os tokens mais antigos são descartados — o que pode discretamente remover instruções colocadas no início do seu prompt. O melhor é ficar confortavelmente abaixo do limite.
O prompt e a resposta compartilham a janela?
Sim. Se um modelo tem uma janela de 128K e o seu prompt tem 120K tokens, restam apenas cerca de 8K para a resposta. Reserve sempre espaço para a saída esperada.
Quais modelos têm as maiores janelas de contexto?
Vários modelos recentes da OpenAI e do Google oferecem cerca de um milhão de tokens, enquanto muitos modelos em produção ficam entre 128K e 200K. A tabela de referência desta ferramenta indica o limite de cada modelo.