Verificador de janela de contexto

Modelo

Reservar para a resposta (tokens de saída esperados)

Seu prompt Estimativa

Processado localmente

0 / 1,000,000 tokens

0% da janela utilizada

Tokens usados

Reservados para a resposta

1,000,000

Tokens restantes

Referência de janelas de contexto Atualizado em June 2026

Modelo	Provedor	Janela de contexto
GPT-5.5	OpenAI	~1.1M tokens
GPT-5.4	OpenAI	~1.1M tokens
Gemini 3.5 Flash	Google	~1M tokens
Gemini 3.1 Pro (Preview)	Google	~1M tokens
Gemini 3.1 Flash-Lite	Google	~1M tokens
Gemini 3 Flash (Preview)	Google	~1M tokens
Gemini 2.5 Pro	Google	~1M tokens
Gemini 2.5 Flash	Google	~1M tokens
Gemini 2.5 Flash-Lite	Google	~1M tokens
GPT-4.1	OpenAI	~1M tokens
GPT-4.1 mini	OpenAI	~1M tokens
GPT-4.1 nano	OpenAI	~1M tokens
Claude Opus 4.8	Anthropic	~1M tokens
Claude Sonnet 4.6	Anthropic	~1M tokens
Claude Fable 5	Anthropic	~1M tokens
DeepSeek-V4-Flash	DeepSeek	~1M tokens
DeepSeek-V4-Pro	DeepSeek	~1M tokens
Qwen3.5-Plus	Alibaba	~1M tokens
Qwen-Plus	Alibaba	~1M tokens
Qwen3.5-Flash	Alibaba	~1M tokens
Qwen-Flash	Alibaba	~1M tokens
GLM-5.2	Zhipu AI	~1M tokens
GPT-5.4 mini	OpenAI	400,000 tokens
GPT-5.4 nano	OpenAI	400,000 tokens
GPT-5	OpenAI	400,000 tokens
GPT-5 mini	OpenAI	400,000 tokens
GPT-5 nano	OpenAI	400,000 tokens
Kimi K2.7 Code	Moonshot AI	262,144 tokens
Kimi K2.6	Moonshot AI	262,144 tokens
Kimi K2.5	Moonshot AI	262,144 tokens
Qwen3-Max	Alibaba	262,144 tokens
o3	OpenAI	200,000 tokens
o4-mini	OpenAI	200,000 tokens
Claude Opus 4.5	Anthropic	200,000 tokens
Claude Sonnet 4.5	Anthropic	200,000 tokens
Claude Haiku 4.5	Anthropic	200,000 tokens
GLM-5.1	Zhipu AI	200,000 tokens
GLM-5	Zhipu AI	200,000 tokens
GLM-4.7	Zhipu AI	200,000 tokens
GLM-4.7-FlashX	Zhipu AI	200,000 tokens
GLM-4.7-Flash	Zhipu AI	200,000 tokens
GLM-4.6	Zhipu AI	200,000 tokens
Moonshot V1 128k	Moonshot AI	131,072 tokens
QwQ-Plus	Alibaba	131,072 tokens
GLM-4.5	Zhipu AI	131,072 tokens
GLM-4.5-Air	Zhipu AI	131,072 tokens
Llama 3.3 70B	Meta	131,072 tokens
Llama 3.1 405B	Meta	131,072 tokens
Llama 3.1 8B	Meta	131,072 tokens
GPT-4o	OpenAI	128,000 tokens
GPT-4o mini	OpenAI	128,000 tokens
Moonshot V1 32k	Moonshot AI	32,768 tokens
GPT-3.5 Turbo	OpenAI	16,385 tokens
Moonshot V1 8k	Moonshot AI	8,192 tokens

Sobre esta ferramenta

A janela de contexto de um modelo é o número máximo de tokens que ele pode considerar de uma só vez — o prompt e a completação somados. Se você a ultrapassar, a requisição é rejeitada ou silenciosamente truncada, descartando o início do seu prompt. Esta ferramenta conta o seu texto em relação ao limite do modelo selecionado e mostra o resultado como uma barra de progresso com os tokens usados, a porcentagem da janela consumida e os tokens restantes para a resposta.

As janelas de contexto vão de alguns milhares de tokens nos modelos mais antigos a mais de um milhão nos mais recentes. Lembre-se de que a janela é compartilhada: cada token gasto no prompt é um token a menos disponível para a resposta, então deixe folga para a saída que você espera. As contagens da OpenAI são exatas graças ao tiktoken; as de outros provedores são estimativas baseadas no número de caracteres.

A janela é compartilhada entre entrada e saída — reserve espaço para a resposta, não apenas para o prompt.

Perguntas frequentes

O que é uma janela de contexto?

É o número total de tokens que um modelo consegue manter na memória de trabalho para uma única requisição, cobrindo tanto o seu prompt quanto a resposta gerada. Pense nela como a capacidade de atenção de curto prazo do modelo, medida em tokens.

O que acontece se eu ultrapassá-la?

Dependendo da API, a requisição falha com um erro ou é truncada — geralmente os tokens mais antigos são descartados — o que pode discretamente remover instruções colocadas no início do seu prompt. O melhor é ficar confortavelmente abaixo do limite.

O prompt e a resposta compartilham a janela?

Sim. Se um modelo tem uma janela de 128K e o seu prompt tem 120K tokens, restam apenas cerca de 8K para a resposta. Reserve sempre espaço para a saída esperada.

Quais modelos têm as maiores janelas de contexto?

Vários modelos recentes da OpenAI e do Google oferecem cerca de um milhão de tokens, enquanto muitos modelos em produção ficam entre 128K e 200K. A tabela de referência desta ferramenta indica o limite de cada modelo.

Sobre esta ferramenta

Perguntas frequentes

Ferramentas relacionadas