上下文窗口检查器

模型

为响应预留（预期输出 token 数）

您的 prompt 估算

本地处理

0 / 1,000,000 tokens

已使用窗口的 0%

已用 token

已为响应预留

1,000,000

剩余 token

上下文窗口参考更新于 June 2026

模型	提供方	上下文窗口
GPT-5.5	OpenAI	~1.1M tokens
GPT-5.4	OpenAI	~1.1M tokens
Gemini 3.5 Flash	Google	~1M tokens
Gemini 3.1 Pro (Preview)	Google	~1M tokens
Gemini 3.1 Flash-Lite	Google	~1M tokens
Gemini 3 Flash (Preview)	Google	~1M tokens
Gemini 2.5 Pro	Google	~1M tokens
Gemini 2.5 Flash	Google	~1M tokens
Gemini 2.5 Flash-Lite	Google	~1M tokens
GPT-4.1	OpenAI	~1M tokens
GPT-4.1 mini	OpenAI	~1M tokens
GPT-4.1 nano	OpenAI	~1M tokens
Claude Opus 4.8	Anthropic	~1M tokens
Claude Sonnet 4.6	Anthropic	~1M tokens
Claude Fable 5	Anthropic	~1M tokens
DeepSeek-V4-Flash	DeepSeek	~1M tokens
DeepSeek-V4-Pro	DeepSeek	~1M tokens
Qwen3.5-Plus	Alibaba	~1M tokens
Qwen-Plus	Alibaba	~1M tokens
Qwen3.5-Flash	Alibaba	~1M tokens
Qwen-Flash	Alibaba	~1M tokens
GLM-5.2	Zhipu AI	~1M tokens
GPT-5.4 mini	OpenAI	400,000 tokens
GPT-5.4 nano	OpenAI	400,000 tokens
GPT-5	OpenAI	400,000 tokens
GPT-5 mini	OpenAI	400,000 tokens
GPT-5 nano	OpenAI	400,000 tokens
Kimi K2.7 Code	Moonshot AI	262,144 tokens
Kimi K2.6	Moonshot AI	262,144 tokens
Kimi K2.5	Moonshot AI	262,144 tokens
Qwen3-Max	Alibaba	262,144 tokens
o3	OpenAI	200,000 tokens
o4-mini	OpenAI	200,000 tokens
Claude Opus 4.5	Anthropic	200,000 tokens
Claude Sonnet 4.5	Anthropic	200,000 tokens
Claude Haiku 4.5	Anthropic	200,000 tokens
GLM-5.1	Zhipu AI	200,000 tokens
GLM-5	Zhipu AI	200,000 tokens
GLM-4.7	Zhipu AI	200,000 tokens
GLM-4.7-FlashX	Zhipu AI	200,000 tokens
GLM-4.7-Flash	Zhipu AI	200,000 tokens
GLM-4.6	Zhipu AI	200,000 tokens
Moonshot V1 128k	Moonshot AI	131,072 tokens
QwQ-Plus	Alibaba	131,072 tokens
GLM-4.5	Zhipu AI	131,072 tokens
GLM-4.5-Air	Zhipu AI	131,072 tokens
Llama 3.3 70B	Meta	131,072 tokens
Llama 3.1 405B	Meta	131,072 tokens
Llama 3.1 8B	Meta	131,072 tokens
GPT-4o	OpenAI	128,000 tokens
GPT-4o mini	OpenAI	128,000 tokens
Moonshot V1 32k	Moonshot AI	32,768 tokens
GPT-3.5 Turbo	OpenAI	16,385 tokens
Moonshot V1 8k	Moonshot AI	8,192 tokens

关于此工具

模型的上下文窗口是它一次能同时考虑的最大 token 数量——提示词与补全合在一起。一旦超出，请求就会被拒绝或被悄悄截断，从而丢掉提示词开头的部分。这个检查工具会将你的文本与所选模型的上限进行对比，并以进度条的形式展示结果，包括已用 token、已消耗窗口的百分比，以及留给响应的剩余 token。

上下文窗口的大小从较旧模型的几千 token，到最新模型的超过一百万 token 不等。请记住窗口是共享的：花在提示词上的每一个 token，都意味着可用于答案的 token 少了一个，所以要为你预期的输出留出余量。OpenAI 的计数通过 tiktoken 精确计算；其他提供商则是基于字符的估算。

窗口在输入和输出之间共享——要为响应预留空间，而不只是为提示词。

常见问题

什么是上下文窗口？

它是模型在单次请求中能保存在工作记忆里的 token 总数，涵盖你的提示词和生成的响应。可以把它看作模型的短期注意力跨度，以 token 计量。

如果超出会发生什么？

视 API 而定，请求要么报错，要么被截断——通常会丢弃最早的 token——这可能会悄悄移除提示词开头的指令。最好把用量控制在远低于上限的水平。

提示词和响应共享窗口吗？

是的。如果一个模型有 128K 的窗口，而你的提示词是 120K token，那么大约只剩 8K 留给答案。请始终为预期的输出预留空间。

哪些模型拥有最大的上下文窗口？

OpenAI 和 Google 的几款近期模型提供大约一百万 token，而许多生产环境的模型在 128K–200K 之间。本工具中的参考表列出了每个模型的上限。

关于此工具

常见问题

相关工具