Inserisci token e volume — tutti i modelli affiancati con costo per richiesta, giornaliero e mensile. Prezzi modificabili.
| {{ __t('model') }} | {{ __t('th_in') }} $/Mtok |
{{ __t('th_out') }} $/Mtok |
{{ __t('th_cache_read') }} $/Mtok |
{{ __t('th_per_request') }} $ |
{{ __t('th_per_day') }} $ |
{{ __t('th_per_month') }} $ |
|---|---|---|---|---|---|---|
| {{ m.name }} {{ m.vendor }} |
{{ calcRequest(m).toFixed(5) }} | {{ calcDay(m).toFixed(2) }} | {{ calcMonth(m).toFixed(2) }} |
I provider fatturano per milione di token (Mtok) — separati input e output. Molti offrono caching: il contesto stabile viene salvato e riletto a una frazione del prezzo input. Risparmio 50–90% sul costo input nei workload con prompt ripetuto.
Classificazione, riassunto, estrazione semplice: i modelli piccoli (Haiku, GPT-4o mini, Gemini Flash, DeepSeek) costano 20–100× meno e coprono l'80% dei carichi. Ragionamento, codice e multi-hop richiedono Opus, GPT-4o, Gemini Pro. Un router in produzione risparmia 40–70%.