Combien de tokens contient votre prompt ?

Estimation rapide des tokens pour Claude, GPT et Gemini côte à côte, avec vérification de la fenêtre de contexte.

{{ stats.chars }} {{ __t('chars') }} · {{ stats.words }} {{ __t('words') }} · {{ stats.lines }} {{ __t('lines') }} · {{ stats.bytes }} {{ __t('bytes') }}

{{ __t('tokens_per_model') }}
{{ m.name }}
{{ estimateTokens(m).toLocaleString() }}
{{ m.note }}
{{ __t('note_label') }}: {{ __t('disclaimer') }}
{{ __t('context_check') }}
{{ __t('th_model') }} {{ __t('th_tokens') }} {{ __t('th_context') }} {{ __t('th_usage') }} {{ __t('th_status') }}
{{ row.name }} {{ row.tokens.toLocaleString() }} {{ row.context.toLocaleString() }} {{ row.pct.toFixed(1) }}% {{ __t('status_ok') }} {{ __t('status_tight') }} {{ __t('status_over') }}

Que sont les tokens ?

Les tokens sont les briques avec lesquelles un LLM découpe le texte. Souvent des fragments de mots — en anglais ~4 caractères ou ¾ d'un mot ; en chinois/japonais souvent 1–2 par caractère. Ils déterminent coût et capacité.

Pourquoi les compteurs diffèrent-ils selon le modèle ?

Chaque fournisseur entraîne son propre tokenizer. GPT-4o utilise o200k_base (~200k) ; les anciens GPT cl100k_base (100k). Claude et Gemini ont les leurs. « internationalization » peut faire 4 ou 6+ tokens. Les écarts sont plus grands en arabe, thaï, CJK.

Conseils pratiques

  • Règle : 1 token ≈ 4 car. anglais, 3 car. français, 1–2 par caractère CJK.
  • Code et JSON consomment plus de tokens à cause des caractères spéciaux — la notation compacte économise.
  • Prompts longs : activez le caching — économise jusqu'à 90 % du coût d'entrée.