Voer tokens en volume in — alle modellen naast elkaar met kosten per request, per dag en per maand. Prijzen aanpasbaar.
| {{ __t('model') }} | {{ __t('th_in') }} $/Mtok |
{{ __t('th_out') }} $/Mtok |
{{ __t('th_cache_read') }} $/Mtok |
{{ __t('th_per_request') }} $ |
{{ __t('th_per_day') }} $ |
{{ __t('th_per_month') }} $ |
|---|---|---|---|---|---|---|
| {{ m.name }} {{ m.vendor }} |
{{ calcRequest(m).toFixed(5) }} | {{ calcDay(m).toFixed(2) }} | {{ calcMonth(m).toFixed(2) }} |
Providers rekenen per miljoen tokens (Mtok), apart voor input en output. Veel bieden caching: stabiele context wordt gecached en daarna voor een fractie van de input-prijs gelezen. Bij hergebruikte system prompts scheelt dat 50–90% op de input.
Classificatie, samenvatten, eenvoudige extractie: kleine modellen (Haiku, GPT-4o mini, Gemini Flash, DeepSeek) zijn 20–100× goedkoper en dekken 80% van de workloads. Redeneren, code en multi-hop vragen om Opus, GPT-4o, Gemini Pro. Een router in productie scheelt 40–70%.