Snelle tokenraming voor Claude, GPT en Gemini naast elkaar, met contextvenster-check.
| {{ __t('th_model') }} | {{ __t('th_tokens') }} | {{ __t('th_context') }} | {{ __t('th_usage') }} | {{ __t('th_status') }} |
|---|---|---|---|---|
| {{ row.name }} | {{ row.tokens.toLocaleString() }} | {{ row.context.toLocaleString() }} | {{ row.pct.toFixed(1) }}% | {{ __t('status_ok') }} {{ __t('status_tight') }} {{ __t('status_over') }} |
Tokens zijn de bouwstenen waarin een LLM tekst opbreekt. Meestal woordfragmenten — in Engels ~4 tekens of ¾ woord; in Chinees/Japans vaak 1–2 tokens per teken. Bepalen kosten en capaciteit.
Elke provider traint zijn eigen tokenizer. GPT-4o gebruikt o200k_base (~200k); oudere GPT cl100k_base (100k). Claude en Gemini hebben hun eigen. "internationalization" kan 4, 6+ tokens worden. Grootste verschillen in niet-Latijns schrift.