OpenReplay Logo
12k
12k

Verificador de janela de contexto

Verifique se o seu prompt cabe na janela de contexto de um modelo. Cole o texto, escolha um modelo e veja os tokens usados, os tokens restantes e o quão perto você está do limite.

Estimativa
Processado localmente
0 / 1,000,000 tokens
0% da janela utilizada
0
Tokens usados
0
Reservados para a resposta
1,000,000
Tokens restantes
Referência de janelas de contexto Atualizado em June 2026
Modelo Provedor Janela de contexto
GPT-5.5 OpenAI ~1.1M tokens
GPT-5.4 OpenAI ~1.1M tokens
Gemini 3.5 Flash Google ~1M tokens
Gemini 3.1 Pro (Preview) Google ~1M tokens
Gemini 3.1 Flash-Lite Google ~1M tokens
Gemini 3 Flash (Preview) Google ~1M tokens
Gemini 2.5 Pro Google ~1M tokens
Gemini 2.5 Flash Google ~1M tokens
Gemini 2.5 Flash-Lite Google ~1M tokens
GPT-4.1 OpenAI ~1M tokens
GPT-4.1 mini OpenAI ~1M tokens
GPT-4.1 nano OpenAI ~1M tokens
Claude Opus 4.8 Anthropic ~1M tokens
Claude Sonnet 4.6 Anthropic ~1M tokens
Claude Fable 5 Anthropic ~1M tokens
DeepSeek-V4-Flash DeepSeek ~1M tokens
DeepSeek-V4-Pro DeepSeek ~1M tokens
Qwen3.5-Plus Alibaba ~1M tokens
Qwen-Plus Alibaba ~1M tokens
Qwen3.5-Flash Alibaba ~1M tokens
Qwen-Flash Alibaba ~1M tokens
GLM-5.2 Zhipu AI ~1M tokens
GPT-5.4 mini OpenAI 400,000 tokens
GPT-5.4 nano OpenAI 400,000 tokens
GPT-5 OpenAI 400,000 tokens
GPT-5 mini OpenAI 400,000 tokens
GPT-5 nano OpenAI 400,000 tokens
Kimi K2.7 Code Moonshot AI 262,144 tokens
Kimi K2.6 Moonshot AI 262,144 tokens
Kimi K2.5 Moonshot AI 262,144 tokens
Qwen3-Max Alibaba 262,144 tokens
o3 OpenAI 200,000 tokens
o4-mini OpenAI 200,000 tokens
Claude Opus 4.5 Anthropic 200,000 tokens
Claude Sonnet 4.5 Anthropic 200,000 tokens
Claude Haiku 4.5 Anthropic 200,000 tokens
GLM-5.1 Zhipu AI 200,000 tokens
GLM-5 Zhipu AI 200,000 tokens
GLM-4.7 Zhipu AI 200,000 tokens
GLM-4.7-FlashX Zhipu AI 200,000 tokens
GLM-4.7-Flash Zhipu AI 200,000 tokens
GLM-4.6 Zhipu AI 200,000 tokens
Moonshot V1 128k Moonshot AI 131,072 tokens
QwQ-Plus Alibaba 131,072 tokens
GLM-4.5 Zhipu AI 131,072 tokens
GLM-4.5-Air Zhipu AI 131,072 tokens
Llama 3.3 70B Meta 131,072 tokens
Llama 3.1 405B Meta 131,072 tokens
Llama 3.1 8B Meta 131,072 tokens
GPT-4o OpenAI 128,000 tokens
GPT-4o mini OpenAI 128,000 tokens
Moonshot V1 32k Moonshot AI 32,768 tokens
GPT-3.5 Turbo OpenAI 16,385 tokens
Moonshot V1 8k Moonshot AI 8,192 tokens

Sobre esta ferramenta

A janela de contexto de um modelo é o número máximo de tokens que ele pode considerar de uma só vez — o prompt e a completação somados. Se você a ultrapassar, a requisição é rejeitada ou silenciosamente truncada, descartando o início do seu prompt. Esta ferramenta conta o seu texto em relação ao limite do modelo selecionado e mostra o resultado como uma barra de progresso com os tokens usados, a porcentagem da janela consumida e os tokens restantes para a resposta.

As janelas de contexto vão de alguns milhares de tokens nos modelos mais antigos a mais de um milhão nos mais recentes. Lembre-se de que a janela é compartilhada: cada token gasto no prompt é um token a menos disponível para a resposta, então deixe folga para a saída que você espera. As contagens da OpenAI são exatas graças ao tiktoken; as de outros provedores são estimativas baseadas no número de caracteres.

A janela é compartilhada entre entrada e saída — reserve espaço para a resposta, não apenas para o prompt.

Perguntas frequentes

O que é uma janela de contexto?

É o número total de tokens que um modelo consegue manter na memória de trabalho para uma única requisição, cobrindo tanto o seu prompt quanto a resposta gerada. Pense nela como a capacidade de atenção de curto prazo do modelo, medida em tokens.

O que acontece se eu ultrapassá-la?

Dependendo da API, a requisição falha com um erro ou é truncada — geralmente os tokens mais antigos são descartados — o que pode discretamente remover instruções colocadas no início do seu prompt. O melhor é ficar confortavelmente abaixo do limite.

O prompt e a resposta compartilham a janela?

Sim. Se um modelo tem uma janela de 128K e o seu prompt tem 120K tokens, restam apenas cerca de 8K para a resposta. Reserve sempre espaço para a saída esperada.

Quais modelos têm as maiores janelas de contexto?

Vários modelos recentes da OpenAI e do Google oferecem cerca de um milhão de tokens, enquanto muitos modelos em produção ficam entre 128K e 200K. A tabela de referência desta ferramenta indica o limite de cada modelo.