¿Cuántos tokens tiene tu prompt?

Estimación rápida de tokens para Claude, GPT y Gemini, todos en paralelo, con verificación de ventana de contexto.

{{ stats.chars }} {{ __t('chars') }} · {{ stats.words }} {{ __t('words') }} · {{ stats.lines }} {{ __t('lines') }} · {{ stats.bytes }} {{ __t('bytes') }}

{{ __t('tokens_per_model') }}
{{ m.name }}
{{ estimateTokens(m).toLocaleString() }}
{{ m.note }}
{{ __t('note_label') }}: {{ __t('disclaimer') }}
{{ __t('context_check') }}
{{ __t('th_model') }} {{ __t('th_tokens') }} {{ __t('th_context') }} {{ __t('th_usage') }} {{ __t('th_status') }}
{{ row.name }} {{ row.tokens.toLocaleString() }} {{ row.context.toLocaleString() }} {{ row.pct.toFixed(1) }}% {{ __t('status_ok') }} {{ __t('status_tight') }} {{ __t('status_over') }}

¿Qué son los tokens?

Los tokens son las piezas en las que un LLM divide el texto. Un token suele ser un fragmento de palabra — en inglés ~4 caracteres o ¾ de palabra; en chino/japonés a menudo 1–2 tokens por carácter. Determinan coste y capacidad.

¿Por qué difieren los valores entre modelos?

Cada proveedor entrena su propio tokenizador. GPT-4o usa o200k_base (~200k); GPT antiguos cl100k_base (100k). Claude y Gemini tienen tokenizadores propios. "internationalization" puede ser 4, 6+ tokens según el tokenizer. Mayores diferencias en árabe, tailandés, CJK.

Consejos prácticos

  • Regla: 1 token ≈ 4 caract. inglés, 3 caract. español, 1–2 por carácter CJK.
  • Código y JSON suelen usar más tokens por caracteres especiales — notación compacta ayuda.
  • Prompts largos: activa la caché de prompts — ahorra hasta 90% del coste input.