Wie viele Tokens hat dein Prompt?

Texte schnell für Claude, GPT und Gemini schätzen — alle Modelle nebeneinander, mit Context-Window-Check.

{{ stats.chars }} {{ __t('chars') }} · {{ stats.words }} {{ __t('words') }} · {{ stats.lines }} {{ __t('lines') }} · {{ stats.bytes }} {{ __t('bytes') }}

{{ __t('tokens_per_model') }}
{{ m.name }}
{{ estimateTokens(m).toLocaleString() }}
{{ m.note }}
{{ __t('note_label') }}: {{ __t('disclaimer') }}
{{ __t('context_check') }}
{{ __t('th_model') }} {{ __t('th_tokens') }} {{ __t('th_context') }} {{ __t('th_usage') }} {{ __t('th_status') }}
{{ row.name }} {{ row.tokens.toLocaleString() }} {{ row.context.toLocaleString() }} {{ row.pct.toFixed(1) }}% {{ __t('status_ok') }} {{ __t('status_tight') }} {{ __t('status_over') }}

Was sind Tokens?

Tokens sind die Bausteine, in die ein LLM einen Text zerlegt, bevor es ihn verarbeitet. Ein Token ist meist ein Wortfragment — bei englischem Text ungefähr 4 Zeichen oder ¾ eines Wortes, bei chinesischer oder japanischer Schrift oft 1–2 Tokens pro Zeichen. Tokens bestimmen sowohl die Kosten (Abrechnung pro Million Tokens) als auch die Kapazität (Context-Window in Tokens).

Warum unterscheiden sich die Werte zwischen Modellen?

Jeder LLM-Anbieter trainiert seinen eigenen Tokenizer auf einem bestimmten Korpus. GPT-4o nutzt o200k_base mit ~200k Vokabeln, ältere GPT-Modelle cl100k_base mit 100k. Claude und Gemini haben eigene Tokenizer mit anderen Subword-Splits. Das gleiche „internationalization“ wird je nach Tokenizer in 4, 6 oder mehr Tokens zerlegt. Bei Sprachen mit speziellen Skripten (Arabisch, Thai, CJK) sind die Unterschiede besonders groß.

Praktische Tipps

  • Faustregel: 1 Token ≈ 4 Zeichen Englisch, 3 Zeichen Deutsch, 1–2 Tokens pro CJK-Zeichen.
  • Code und JSON brauchen wegen Sonderzeichen oft mehr Tokens — kompakte Notation kann sparen.
  • Bei langen System-Prompts: Prompt-Caching aktivieren — spart bis zu 90 % der Input-Kosten.