Saisissez vos tokens et volume — tous les modèles côte à côte avec coût par requête, journalier et mensuel. Prix modifiables.
| {{ __t('model') }} | {{ __t('th_in') }} $/Mtok |
{{ __t('th_out') }} $/Mtok |
{{ __t('th_cache_read') }} $/Mtok |
{{ __t('th_per_request') }} $ |
{{ __t('th_per_day') }} $ |
{{ __t('th_per_month') }} $ |
|---|---|---|---|---|---|---|
| {{ m.name }} {{ m.vendor }} |
{{ calcRequest(m).toFixed(5) }} | {{ calcDay(m).toFixed(2) }} | {{ calcMonth(m).toFixed(2) }} |
Les fournisseurs facturent au million de tokens (Mtok) — séparément l'entrée et la sortie. Beaucoup proposent un tarif de cache : le contexte stable est mis en cache et relu à une fraction du prix d'entrée. Économies de 50 à 90 % sur l'entrée quand le prompt est répété.
Classification, résumé, extraction simple : les petits modèles (Haiku, GPT-4o mini, Gemini Flash, DeepSeek) sont 20–100× moins chers et couvrent 80 % des cas. Raisonnement, code, multi-saut : Opus, GPT-4o, Gemini Pro. Un routeur en prod économise 40–70 %.