推論モデルでは、思考トークンをここで数えてください —— 出力として課金されます。
カウントしたトークンは 入力トークン 欄に入力され、モデルを変更すると再カウントされます。
コスト: Claude Opus 4.8
すべてのモデルを比較
価格の更新日:June 2026| モデル | 入力 $/1M | 出力 $/1M | コスト / 呼び出し | コスト / N リクエスト |
|---|
List prices in USD per 1 million tokens, standard synchronous tier. Providers change pricing and ship new models often, so treat these as a starting point and confirm against the provider's pricing page before budgeting. See priceNote for context-length tiers, long-context surcharges, cache-hit rates, and thinking-mode differences. Chinese providers (DeepSeek, Moonshot/Kimi, Qwen, GLM) are shown at their international USD rates. Token counts are exact for OpenAI (tiktoken); all other providers are approximate (no official public client-side tokenizer). Note: Anthropic models 4.7+ (Opus 4.8, Fable 5) use a newer tokenizer that yields ~30% more tokens than 4.5/4.6 — reflected in charsPerToken.
このツールについて
すべての LLM API はトークン単位で課金し、入力(プロンプト)と出力(補完)に別々のレートが設定されているため、ある機能のコストは、各方向に何トークンが流れるかと、モデルをどれくらいの頻度で呼び出すかによって決まります。この計算ツールはそれらの数値を 1 回の呼び出しあたりのコストに変換し、数千から数百万のリクエストにわたって試算したうえで、すべてのモデルを並べて表示するので、同じワークロードが各モデルでいくらかかるかを確認できます。
入力トークンと出力トークンを直接入力するか、プロンプトを貼り付けて共有トークナイザーでそのトークン数を数えてください — OpenAI には正確、他のプロバイダーには推定です。価格は 100 万トークンあたりの表示レートで、最終更新日は比較表の上に表示されます。プロバイダーは頻繁に価格を変更し新しいモデルを出すため、合計はよく練られた見積もりとして扱い、予算を確定する前にプロバイダーと照合してください。
表示価格には、ボリューム割引、キャッシュ入力価格、バッチ階層が含まれていない場合があります。すべてはブラウザ内でローカルに計算されます。
よくある質問
コストはどのように計算されますか?
入力トークン数にモデルの入力価格を掛けたものと、出力トークン数にその出力価格を掛けたものを、それぞれ 100 万トークンあたりの表示レートから按分して合計します。1 回の呼び出しあたりの合計はその和であり、試算はそれをあなたのリクエスト量に掛けるだけです。
入力と出力で価格が異なるのはなぜですか?
出力を生成することは入力を読むことよりも計算負荷が高いため、ほとんどのプロバイダーは出力トークンあたりの料金を入力トークンよりも高く — しばしば数倍 — 設定します。だからこそ、長い回答を返すモデルは、その入力価格だけから示唆されるよりもはるかに高くつくことがあるのです。
これらの価格は最新ですか?
表の上に表示された日付時点で公開された表示価格を反映しており、1 か所に保管して定期的に更新しています。プロバイダーは頻繁に価格を調整し新しいモデルをリリースし、割引、キャッシュ入力レート、バッチ階層は含まれていないため、数値に頼る前にプロバイダーと照合してください。
キャッシュやバッチの価格はどうですか?
多くのプロバイダーは、キャッシュされたプロンプトのプレフィックスや非同期のバッチジョブに対してより安いレートを提供しています。この計算ツールは標準のリアルタイムレートを使うため、それらの階層を利用する場合は実際のコストは表示よりも低くなります。