估算
本地处理
0 / 1,000,000 tokens
已使用窗口的 0%
0
已用 token
0
已为响应预留
1,000,000
剩余 token
上下文窗口参考 更新于 June 2026
| 模型 | 提供方 | 上下文窗口 |
|---|---|---|
| GPT-5.5 | OpenAI | ~1.1M tokens |
| GPT-5.4 | OpenAI | ~1.1M tokens |
| Gemini 3.5 Flash | ~1M tokens | |
| Gemini 3.1 Pro (Preview) | ~1M tokens | |
| Gemini 3.1 Flash-Lite | ~1M tokens | |
| Gemini 3 Flash (Preview) | ~1M tokens | |
| Gemini 2.5 Pro | ~1M tokens | |
| Gemini 2.5 Flash | ~1M tokens | |
| Gemini 2.5 Flash-Lite | ~1M tokens | |
| GPT-4.1 | OpenAI | ~1M tokens |
| GPT-4.1 mini | OpenAI | ~1M tokens |
| GPT-4.1 nano | OpenAI | ~1M tokens |
| Claude Opus 4.8 | Anthropic | ~1M tokens |
| Claude Sonnet 4.6 | Anthropic | ~1M tokens |
| Claude Fable 5 | Anthropic | ~1M tokens |
| DeepSeek-V4-Flash | DeepSeek | ~1M tokens |
| DeepSeek-V4-Pro | DeepSeek | ~1M tokens |
| Qwen3.5-Plus | Alibaba | ~1M tokens |
| Qwen-Plus | Alibaba | ~1M tokens |
| Qwen3.5-Flash | Alibaba | ~1M tokens |
| Qwen-Flash | Alibaba | ~1M tokens |
| GLM-5.2 | Zhipu AI | ~1M tokens |
| GPT-5.4 mini | OpenAI | 400,000 tokens |
| GPT-5.4 nano | OpenAI | 400,000 tokens |
| GPT-5 | OpenAI | 400,000 tokens |
| GPT-5 mini | OpenAI | 400,000 tokens |
| GPT-5 nano | OpenAI | 400,000 tokens |
| Kimi K2.7 Code | Moonshot AI | 262,144 tokens |
| Kimi K2.6 | Moonshot AI | 262,144 tokens |
| Kimi K2.5 | Moonshot AI | 262,144 tokens |
| Qwen3-Max | Alibaba | 262,144 tokens |
| o3 | OpenAI | 200,000 tokens |
| o4-mini | OpenAI | 200,000 tokens |
| Claude Opus 4.5 | Anthropic | 200,000 tokens |
| Claude Sonnet 4.5 | Anthropic | 200,000 tokens |
| Claude Haiku 4.5 | Anthropic | 200,000 tokens |
| GLM-5.1 | Zhipu AI | 200,000 tokens |
| GLM-5 | Zhipu AI | 200,000 tokens |
| GLM-4.7 | Zhipu AI | 200,000 tokens |
| GLM-4.7-FlashX | Zhipu AI | 200,000 tokens |
| GLM-4.7-Flash | Zhipu AI | 200,000 tokens |
| GLM-4.6 | Zhipu AI | 200,000 tokens |
| Moonshot V1 128k | Moonshot AI | 131,072 tokens |
| QwQ-Plus | Alibaba | 131,072 tokens |
| GLM-4.5 | Zhipu AI | 131,072 tokens |
| GLM-4.5-Air | Zhipu AI | 131,072 tokens |
| Llama 3.3 70B | Meta | 131,072 tokens |
| Llama 3.1 405B | Meta | 131,072 tokens |
| Llama 3.1 8B | Meta | 131,072 tokens |
| GPT-4o | OpenAI | 128,000 tokens |
| GPT-4o mini | OpenAI | 128,000 tokens |
| Moonshot V1 32k | Moonshot AI | 32,768 tokens |
| GPT-3.5 Turbo | OpenAI | 16,385 tokens |
| Moonshot V1 8k | Moonshot AI | 8,192 tokens |
关于此工具
模型的上下文窗口是它一次能同时考虑的最大 token 数量——提示词与补全合在一起。一旦超出,请求就会被拒绝或被悄悄截断,从而丢掉提示词开头的部分。这个检查工具会将你的文本与所选模型的上限进行对比,并以进度条的形式展示结果,包括已用 token、已消耗窗口的百分比,以及留给响应的剩余 token。
上下文窗口的大小从较旧模型的几千 token,到最新模型的超过一百万 token 不等。请记住窗口是共享的:花在提示词上的每一个 token,都意味着可用于答案的 token 少了一个,所以要为你预期的输出留出余量。OpenAI 的计数通过 tiktoken 精确计算;其他提供商则是基于字符的估算。
窗口在输入和输出之间共享——要为响应预留空间,而不只是为提示词。
常见问题
什么是上下文窗口?
它是模型在单次请求中能保存在工作记忆里的 token 总数,涵盖你的提示词和生成的响应。可以把它看作模型的短期注意力跨度,以 token 计量。
如果超出会发生什么?
视 API 而定,请求要么报错,要么被截断——通常会丢弃最早的 token——这可能会悄悄移除提示词开头的指令。最好把用量控制在远低于上限的水平。
提示词和响应共享窗口吗?
是的。如果一个模型有 128K 的窗口,而你的提示词是 120K token,那么大约只剩 8K 留给答案。请始终为预期的输出预留空间。
哪些模型拥有最大的上下文窗口?
OpenAI 和 Google 的几款近期模型提供大约一百万 token,而许多生产环境的模型在 128K–200K 之间。本工具中的参考表列出了每个模型的上限。