Quantos tokens seu prompt tem?

Estimativa rápida de tokens para Claude, GPT e Gemini lado a lado, com verificação da janela de contexto.

{{ stats.chars }} {{ __t('chars') }} · {{ stats.words }} {{ __t('words') }} · {{ stats.lines }} {{ __t('lines') }} · {{ stats.bytes }} {{ __t('bytes') }}

{{ __t('tokens_per_model') }}
{{ m.name }}
{{ estimateTokens(m).toLocaleString() }}
{{ m.note }}
{{ __t('note_label') }}: {{ __t('disclaimer') }}
{{ __t('context_check') }}
{{ __t('th_model') }} {{ __t('th_tokens') }} {{ __t('th_context') }} {{ __t('th_usage') }} {{ __t('th_status') }}
{{ row.name }} {{ row.tokens.toLocaleString() }} {{ row.context.toLocaleString() }} {{ row.pct.toFixed(1) }}% {{ __t('status_ok') }} {{ __t('status_tight') }} {{ __t('status_over') }}

O que são tokens?

Tokens são as unidades em que um LLM quebra o texto. Geralmente fragmentos de palavra — em inglês ~4 caracteres ou ¾ de palavra; em chinês/japonês frequentemente 1–2 por caractere. Definem custo e capacidade.

Por que os valores diferem entre modelos?

Cada provedor treina seu próprio tokenizer. GPT-4o usa o200k_base (~200k); GPT antigo cl100k_base (100k). Claude e Gemini têm os seus. "internationalization" pode virar 4, 6+ tokens. Diferenças maiores em árabe, tailandês, CJK.

Dicas práticas

  • Regra: 1 token ≈ 4 caract. inglês, 3 caract. português, 1–2 por caractere CJK.
  • Código e JSON usam mais tokens — notação compacta economiza.
  • Prompts longos: ative cache de prompt — economiza até 90% do custo de input.