Estimation rapide des tokens pour Claude, GPT et Gemini côte à côte, avec vérification de la fenêtre de contexte.
| {{ __t('th_model') }} | {{ __t('th_tokens') }} | {{ __t('th_context') }} | {{ __t('th_usage') }} | {{ __t('th_status') }} |
|---|---|---|---|---|
| {{ row.name }} | {{ row.tokens.toLocaleString() }} | {{ row.context.toLocaleString() }} | {{ row.pct.toFixed(1) }}% | {{ __t('status_ok') }} {{ __t('status_tight') }} {{ __t('status_over') }} |
Les tokens sont les briques avec lesquelles un LLM découpe le texte. Souvent des fragments de mots — en anglais ~4 caractères ou ¾ d'un mot ; en chinois/japonais souvent 1–2 par caractère. Ils déterminent coût et capacité.
Chaque fournisseur entraîne son propre tokenizer. GPT-4o utilise o200k_base (~200k) ; les anciens GPT cl100k_base (100k). Claude et Gemini ont les leurs. « internationalization » peut faire 4 ou 6+ tokens. Les écarts sont plus grands en arabe, thaï, CJK.