В моделях с рассуждением учитывайте здесь токены размышлений — они тарифицируются как выходные.
Подсчитанные токены заполняют поле Входные токены и пересчитываются при смене модели.
Стоимость для Claude Opus 4.8
Сравнить все модели
Цены обновлены June 2026| Модель | Вход $/1M | Выход $/1M | Стоимость / вызов | Стоимость / N запр. |
|---|
List prices in USD per 1 million tokens, standard synchronous tier. Providers change pricing and ship new models often, so treat these as a starting point and confirm against the provider's pricing page before budgeting. See priceNote for context-length tiers, long-context surcharges, cache-hit rates, and thinking-mode differences. Chinese providers (DeepSeek, Moonshot/Kimi, Qwen, GLM) are shown at their international USD rates. Token counts are exact for OpenAI (tiktoken); all other providers are approximate (no official public client-side tokenizer). Note: Anthropic models 4.7+ (Opus 4.8, Fable 5) use a newer tokenizer that yields ~30% more tokens than 4.5/4.6 — reflected in charsPerToken.
Об этом инструменте
Каждый API LLM тарифицирует по токенам, с отдельными ставками для ввода (промпта) и вывода (завершения), поэтому стоимость функции зависит от того, сколько токенов проходит в каждом направлении и как часто вы вызываете модель. Этот калькулятор превращает эти числа в стоимость за вызов и проецирует их на тысячи или миллионы запросов, затем выстраивает каждую модель бок о бок, чтобы вы могли видеть, во что обходится та же нагрузка на каждой.
Введите токены ввода и вывода напрямую или вставьте свой промпт, чтобы подсчитать его токены с помощью общего токенизатора — точно для OpenAI, оценочно для других поставщиков. Цены — это прейскурантные ставки за миллион токенов, а дата их последнего обновления показана над таблицей сравнения; поскольку поставщики часто меняют цены и выпускают новые модели, относитесь к итогам как к обоснованной оценке и подтверждайте у поставщика, прежде чем закладывать бюджет.
Прейскурантные цены могут не учитывать оптовые скидки, тарификацию кешированного ввода и пакетные уровни. Всё вычисляется локально в вашем браузере.
Часто задаваемые вопросы
Как рассчитывается стоимость?
Токены ввода, умноженные на цену ввода модели, плюс токены вывода, умноженные на её цену вывода, каждое из которых пропорционально пересчитано из прейскурантной ставки за миллион токенов. Итог за вызов — это сумма, а проекции просто умножают её на ваш объём запросов.
Почему ввод и вывод тарифицируются по-разному?
Генерация вывода более ресурсоёмка, чем чтение ввода, поэтому большинство поставщиков берут больше — часто в несколько раз больше — за токен вывода, чем за токен ввода. Вот почему модель, возвращающая длинные ответы, может стоить гораздо больше, чем предполагает одна лишь цена её ввода.
Актуальны ли эти цены?
Они отражают опубликованные прейскурантные цены на дату, показанную над таблицей, хранящиеся в одном месте, которое мы периодически обновляем. Поставщики часто корректируют цены и выпускают новые модели, а скидки, ставки для кешированного ввода и пакетные уровни не включены, поэтому проверяйте у поставщика, прежде чем полагаться на цифру.
А как насчёт кешированной или пакетной тарификации?
Многие поставщики предлагают более дешёвые ставки для кешированных префиксов промптов или асинхронных пакетных задач. Этот калькулятор использует стандартные ставки реального времени, поэтому, если вы используете эти уровни, ваша фактическая стоимость будет ниже показанной.