OpenReplay Logo
12k
12k

LLM API 成本计算器

在 GPT、Claude、Gemini 和 Llama 之间估算并比较 LLM API 成本。粘贴一段提示词以自动统计 token,或直接输入数字,然后查看每次调用以及规模化后的成本。

在推理模型上,请在此处统计思考 token —— 它们按输出计费。

本地处理

成本: Claude Opus 4.8

$0.00
输入成本 / 次调用
$0.00
输出成本 / 次调用
$0.00
合计 / 次调用
$0.00
合计 / 1 次请求
$0.00
每 1K 次请求
$0.00
每 1M 次请求

比较所有模型

价格更新于 June 2026
模型 输入 $/1M 输出 $/1M 成本 / 次调用 成本 / N 次请求

List prices in USD per 1 million tokens, standard synchronous tier. Providers change pricing and ship new models often, so treat these as a starting point and confirm against the provider's pricing page before budgeting. See priceNote for context-length tiers, long-context surcharges, cache-hit rates, and thinking-mode differences. Chinese providers (DeepSeek, Moonshot/Kimi, Qwen, GLM) are shown at their international USD rates. Token counts are exact for OpenAI (tiktoken); all other providers are approximate (no official public client-side tokenizer). Note: Anthropic models 4.7+ (Opus 4.8, Fable 5) use a newer tokenizer that yields ~30% more tokens than 4.5/4.6 — reflected in charsPerToken.

关于此工具

每个 LLM API 都按 token 计费,输入(提示词)和输出(补全)有各自独立的费率,因此一项功能的成本取决于每个方向流动的 token 数量以及你调用模型的频率。本计算器将这些数字转换为每次调用的成本,并将其投射到数千或数百万次请求上,然后把每个模型并排列出,让你看清同样的工作负载在每个模型上的花费。

直接输入输入和输出 token,或粘贴你的提示词,用共享的分词器统计其 token——对 OpenAI 精确,对其他供应商为估算。价格为每百万 token 的标价费率,其最后更新的日期显示在对比表上方;由于供应商经常变更定价并发布新模型,请将这些总额视为有充分依据的估算,并在确定预算之前向供应商核实。

标价可能不包含批量折扣、缓存输入定价和批处理层级。一切都在你的浏览器中本地计算。

常见问题

成本是如何计算的?

输入 token 乘以模型的输入价格,加上输出 token 乘以其输出价格,二者均按每百万 token 的标价费率折算。每次调用的总额是二者之和,而投射只是将该总额乘以你的请求量。

为什么输入和输出的定价不同?

生成输出比读取输入更耗费算力,因此大多数供应商对每个输出 token 的收费更高——往往是每个输入 token 的数倍。这就是为什么一个返回长回答的模型,其成本可能远高于仅看其输入价格所暗示的。

这些价格是最新的吗?

它们反映的是表格上方所示日期的已发布标价,集中存放在一处由我们定期更新。供应商会频繁调整定价并发布新模型,且折扣、缓存输入费率和批处理层级均未包含在内,因此在依赖某个数字之前请向供应商核实。

缓存或批处理定价呢?

许多供应商为缓存的提示词前缀或异步批处理任务提供更便宜的费率。本计算器使用标准的实时费率,因此如果你使用那些层级,你的实际成本会低于所示数值。