OpenReplay Logo
12k
12k

上下文窗口检查器

检查你的提示词是否能放入某个模型的上下文窗口。粘贴文本、选择模型,即可查看已用 token、剩余 token 以及距离上限还有多近。

估算
本地处理
0 / 1,000,000 tokens
已使用窗口的 0%
0
已用 token
0
已为响应预留
1,000,000
剩余 token
上下文窗口参考 更新于 June 2026
模型 提供方 上下文窗口
GPT-5.5 OpenAI ~1.1M tokens
GPT-5.4 OpenAI ~1.1M tokens
Gemini 3.5 Flash Google ~1M tokens
Gemini 3.1 Pro (Preview) Google ~1M tokens
Gemini 3.1 Flash-Lite Google ~1M tokens
Gemini 3 Flash (Preview) Google ~1M tokens
Gemini 2.5 Pro Google ~1M tokens
Gemini 2.5 Flash Google ~1M tokens
Gemini 2.5 Flash-Lite Google ~1M tokens
GPT-4.1 OpenAI ~1M tokens
GPT-4.1 mini OpenAI ~1M tokens
GPT-4.1 nano OpenAI ~1M tokens
Claude Opus 4.8 Anthropic ~1M tokens
Claude Sonnet 4.6 Anthropic ~1M tokens
Claude Fable 5 Anthropic ~1M tokens
DeepSeek-V4-Flash DeepSeek ~1M tokens
DeepSeek-V4-Pro DeepSeek ~1M tokens
Qwen3.5-Plus Alibaba ~1M tokens
Qwen-Plus Alibaba ~1M tokens
Qwen3.5-Flash Alibaba ~1M tokens
Qwen-Flash Alibaba ~1M tokens
GLM-5.2 Zhipu AI ~1M tokens
GPT-5.4 mini OpenAI 400,000 tokens
GPT-5.4 nano OpenAI 400,000 tokens
GPT-5 OpenAI 400,000 tokens
GPT-5 mini OpenAI 400,000 tokens
GPT-5 nano OpenAI 400,000 tokens
Kimi K2.7 Code Moonshot AI 262,144 tokens
Kimi K2.6 Moonshot AI 262,144 tokens
Kimi K2.5 Moonshot AI 262,144 tokens
Qwen3-Max Alibaba 262,144 tokens
o3 OpenAI 200,000 tokens
o4-mini OpenAI 200,000 tokens
Claude Opus 4.5 Anthropic 200,000 tokens
Claude Sonnet 4.5 Anthropic 200,000 tokens
Claude Haiku 4.5 Anthropic 200,000 tokens
GLM-5.1 Zhipu AI 200,000 tokens
GLM-5 Zhipu AI 200,000 tokens
GLM-4.7 Zhipu AI 200,000 tokens
GLM-4.7-FlashX Zhipu AI 200,000 tokens
GLM-4.7-Flash Zhipu AI 200,000 tokens
GLM-4.6 Zhipu AI 200,000 tokens
Moonshot V1 128k Moonshot AI 131,072 tokens
QwQ-Plus Alibaba 131,072 tokens
GLM-4.5 Zhipu AI 131,072 tokens
GLM-4.5-Air Zhipu AI 131,072 tokens
Llama 3.3 70B Meta 131,072 tokens
Llama 3.1 405B Meta 131,072 tokens
Llama 3.1 8B Meta 131,072 tokens
GPT-4o OpenAI 128,000 tokens
GPT-4o mini OpenAI 128,000 tokens
Moonshot V1 32k Moonshot AI 32,768 tokens
GPT-3.5 Turbo OpenAI 16,385 tokens
Moonshot V1 8k Moonshot AI 8,192 tokens

关于此工具

模型的上下文窗口是它一次能同时考虑的最大 token 数量——提示词与补全合在一起。一旦超出,请求就会被拒绝或被悄悄截断,从而丢掉提示词开头的部分。这个检查工具会将你的文本与所选模型的上限进行对比,并以进度条的形式展示结果,包括已用 token、已消耗窗口的百分比,以及留给响应的剩余 token。

上下文窗口的大小从较旧模型的几千 token,到最新模型的超过一百万 token 不等。请记住窗口是共享的:花在提示词上的每一个 token,都意味着可用于答案的 token 少了一个,所以要为你预期的输出留出余量。OpenAI 的计数通过 tiktoken 精确计算;其他提供商则是基于字符的估算。

窗口在输入和输出之间共享——要为响应预留空间,而不只是为提示词。

常见问题

什么是上下文窗口?

它是模型在单次请求中能保存在工作记忆里的 token 总数,涵盖你的提示词和生成的响应。可以把它看作模型的短期注意力跨度,以 token 计量。

如果超出会发生什么?

视 API 而定,请求要么报错,要么被截断——通常会丢弃最早的 token——这可能会悄悄移除提示词开头的指令。最好把用量控制在远低于上限的水平。

提示词和响应共享窗口吗?

是的。如果一个模型有 128K 的窗口,而你的提示词是 120K token,那么大约只剩 8K 留给答案。请始终为预期的输出预留空间。

哪些模型拥有最大的上下文窗口?

OpenAI 和 Google 的几款近期模型提供大约一百万 token,而许多生产环境的模型在 128K–200K 之间。本工具中的参考表列出了每个模型的上限。