Hoeveel tokens heeft je prompt?

Snelle tokenraming voor Claude, GPT en Gemini naast elkaar, met contextvenster-check.

{{ stats.chars }} {{ __t('chars') }} · {{ stats.words }} {{ __t('words') }} · {{ stats.lines }} {{ __t('lines') }} · {{ stats.bytes }} {{ __t('bytes') }}

{{ __t('tokens_per_model') }}
{{ m.name }}
{{ estimateTokens(m).toLocaleString() }}
{{ m.note }}
{{ __t('note_label') }}: {{ __t('disclaimer') }}
{{ __t('context_check') }}
{{ __t('th_model') }} {{ __t('th_tokens') }} {{ __t('th_context') }} {{ __t('th_usage') }} {{ __t('th_status') }}
{{ row.name }} {{ row.tokens.toLocaleString() }} {{ row.context.toLocaleString() }} {{ row.pct.toFixed(1) }}% {{ __t('status_ok') }} {{ __t('status_tight') }} {{ __t('status_over') }}

Wat zijn tokens?

Tokens zijn de bouwstenen waarin een LLM tekst opbreekt. Meestal woordfragmenten — in Engels ~4 tekens of ¾ woord; in Chinees/Japans vaak 1–2 tokens per teken. Bepalen kosten en capaciteit.

Waarom verschillen tellingen tussen modellen?

Elke provider traint zijn eigen tokenizer. GPT-4o gebruikt o200k_base (~200k); oudere GPT cl100k_base (100k). Claude en Gemini hebben hun eigen. "internationalization" kan 4, 6+ tokens worden. Grootste verschillen in niet-Latijns schrift.

Praktische tips

  • Vuistregel: 1 token ≈ 4 tekens EN, 3 tekens NL, 1–2 tokens per CJK-teken.
  • Code en JSON gebruiken meer tokens door speciale tekens — compacte notatie scheelt.
  • Lange system prompts: zet prompt caching aan — tot 90% besparing op input.