| Модель | Поставщик | Контекстное окно |
|---|---|---|
| GPT-5.5 | OpenAI | ~1.1M tokens |
| GPT-5.4 | OpenAI | ~1.1M tokens |
| Gemini 3.5 Flash | ~1M tokens | |
| Gemini 3.1 Pro (Preview) | ~1M tokens | |
| Gemini 3.1 Flash-Lite | ~1M tokens | |
| Gemini 3 Flash (Preview) | ~1M tokens | |
| Gemini 2.5 Pro | ~1M tokens | |
| Gemini 2.5 Flash | ~1M tokens | |
| Gemini 2.5 Flash-Lite | ~1M tokens | |
| GPT-4.1 | OpenAI | ~1M tokens |
| GPT-4.1 mini | OpenAI | ~1M tokens |
| GPT-4.1 nano | OpenAI | ~1M tokens |
| Claude Opus 4.8 | Anthropic | ~1M tokens |
| Claude Sonnet 4.6 | Anthropic | ~1M tokens |
| Claude Fable 5 | Anthropic | ~1M tokens |
| DeepSeek-V4-Flash | DeepSeek | ~1M tokens |
| DeepSeek-V4-Pro | DeepSeek | ~1M tokens |
| Qwen3.5-Plus | Alibaba | ~1M tokens |
| Qwen-Plus | Alibaba | ~1M tokens |
| Qwen3.5-Flash | Alibaba | ~1M tokens |
| Qwen-Flash | Alibaba | ~1M tokens |
| GLM-5.2 | Zhipu AI | ~1M tokens |
| GPT-5.4 mini | OpenAI | 400,000 tokens |
| GPT-5.4 nano | OpenAI | 400,000 tokens |
| GPT-5 | OpenAI | 400,000 tokens |
| GPT-5 mini | OpenAI | 400,000 tokens |
| GPT-5 nano | OpenAI | 400,000 tokens |
| Kimi K2.7 Code | Moonshot AI | 262,144 tokens |
| Kimi K2.6 | Moonshot AI | 262,144 tokens |
| Kimi K2.5 | Moonshot AI | 262,144 tokens |
| Qwen3-Max | Alibaba | 262,144 tokens |
| o3 | OpenAI | 200,000 tokens |
| o4-mini | OpenAI | 200,000 tokens |
| Claude Opus 4.5 | Anthropic | 200,000 tokens |
| Claude Sonnet 4.5 | Anthropic | 200,000 tokens |
| Claude Haiku 4.5 | Anthropic | 200,000 tokens |
| GLM-5.1 | Zhipu AI | 200,000 tokens |
| GLM-5 | Zhipu AI | 200,000 tokens |
| GLM-4.7 | Zhipu AI | 200,000 tokens |
| GLM-4.7-FlashX | Zhipu AI | 200,000 tokens |
| GLM-4.7-Flash | Zhipu AI | 200,000 tokens |
| GLM-4.6 | Zhipu AI | 200,000 tokens |
| Moonshot V1 128k | Moonshot AI | 131,072 tokens |
| QwQ-Plus | Alibaba | 131,072 tokens |
| GLM-4.5 | Zhipu AI | 131,072 tokens |
| GLM-4.5-Air | Zhipu AI | 131,072 tokens |
| Llama 3.3 70B | Meta | 131,072 tokens |
| Llama 3.1 405B | Meta | 131,072 tokens |
| Llama 3.1 8B | Meta | 131,072 tokens |
| GPT-4o | OpenAI | 128,000 tokens |
| GPT-4o mini | OpenAI | 128,000 tokens |
| Moonshot V1 32k | Moonshot AI | 32,768 tokens |
| GPT-3.5 Turbo | OpenAI | 16,385 tokens |
| Moonshot V1 8k | Moonshot AI | 8,192 tokens |
Об этом инструменте
Контекстное окно модели — это максимальное число токенов, которое она может учитывать одновременно: промпт и ответ вместе. Если его превысить, запрос будет отклонён или незаметно усечён, удалив начало вашего промпта. Этот инструмент подсчитывает ваш текст относительно лимита выбранной модели и показывает результат в виде индикатора прогресса с числом использованных токенов, долей израсходованного окна и количеством токенов, оставшихся для ответа.
Контекстные окна варьируются от нескольких тысяч токенов у старых моделей до более чем миллиона у новейших. Помните, что окно общее: каждый токен, потраченный на промпт, — это на один токен меньше для ответа, поэтому оставляйте запас для ожидаемого вывода. Подсчёты OpenAI точны благодаря tiktoken; у других провайдеров это оценки на основе количества символов.
Окно делится между вводом и выводом — закладывайте место для ответа, а не только для промпта.
Часто задаваемые вопросы
Что такое контекстное окно?
Это общее число токенов, которое модель может удерживать в рабочей памяти для одного запроса, охватывая как ваш промпт, так и сгенерированный ответ. Считайте это объёмом кратковременного внимания модели, измеряемым в токенах.
Что произойдёт, если я его превышу?
В зависимости от API запрос либо завершается ошибкой, либо усекается — обычно удаляются самые старые токены, — что может незаметно убрать инструкции в начале вашего промпта. Лучше оставаться с комфортным запасом ниже лимита.
Делят ли промпт и ответ одно окно?
Да. Если у модели окно 128K, а ваш промпт занимает 120K токенов, для ответа останется лишь около 8K. Всегда резервируйте место для ожидаемого вывода.
У каких моделей самые большие контекстные окна?
Несколько недавних моделей от OpenAI и Google предлагают около одного миллиона токенов, тогда как многие модели в продакшене находятся в диапазоне 128K–200K. Справочная таблица в этом инструменте указывает лимит для каждой модели.