トークン数とリクエスト数を入力すると、各モデルの1リクエスト・日次・月額コストが並びます。価格は編集可。
| {{ __t('model') }} | {{ __t('th_in') }} $/Mtok |
{{ __t('th_out') }} $/Mtok |
{{ __t('th_cache_read') }} $/Mtok |
{{ __t('th_per_request') }} $ |
{{ __t('th_per_day') }} $ |
{{ __t('th_per_month') }} $ |
|---|---|---|---|---|---|---|
| {{ m.name }} {{ m.vendor }} |
{{ calcRequest(m).toFixed(5) }} | {{ calcDay(m).toFixed(2) }} | {{ calcMonth(m).toFixed(2) }} |
課金は100万トークン (Mtok) 単位で、入力と出力で別レート。多くのベンダーがプロンプトキャッシュを提供:固定文脈はキャッシュされ次回は入力料金の一部で済みます。同じシステムプロンプトを多用すると入力分のコストを50–90%削減可能。
分類・要約・単純抽出は小型モデル(Haiku/GPT-4o mini/Gemini Flash/DeepSeek)が20–100倍安く、ワークロードの8割をカバー。推論・コーディング・多段検索は Opus/GPT-4o/Gemini Pro 向き。ルーティングで40–70%節約。