你的提示词有多少 token?

并列估算 Claude/GPT/Gemini token 数,并显示上下文窗口占用率。

{{ stats.chars }} {{ __t('chars') }} · {{ stats.words }} {{ __t('words') }} · {{ stats.lines }} {{ __t('lines') }} · {{ stats.bytes }} {{ __t('bytes') }}

{{ __t('tokens_per_model') }}
{{ m.name }}
{{ estimateTokens(m).toLocaleString() }}
{{ m.note }}
{{ __t('note_label') }}: {{ __t('disclaimer') }}
{{ __t('context_check') }}
{{ __t('th_model') }} {{ __t('th_tokens') }} {{ __t('th_context') }} {{ __t('th_usage') }} {{ __t('th_status') }}
{{ row.name }} {{ row.tokens.toLocaleString() }} {{ row.context.toLocaleString() }} {{ row.pct.toFixed(1) }}% {{ __t('status_ok') }} {{ __t('status_tight') }} {{ __t('status_over') }}

什么是 token?

Token 是 LLM 处理文本前的最小切分单元,通常是词片段。英文约 4 个字符或一个单词的 3/4;中日文常 1 字 1–2 个 token。Token 决定费用(按百万 token 计)与容量(上下文窗口)。

为什么各模型计数不同?

各家自训分词器。GPT-4o 用 o200k_base(约 20 万词表),旧 GPT 用 cl100k_base(10 万)。Claude、Gemini 各有自家分词器。同一个 "internationalization" 可被切成 4、6 个甚至更多 token。非拉丁字符(阿拉伯、泰、CJK)差异最大。

实用小贴士

  • 经验:1 token ≈ 英文 4 个字符、中文 1 字 1–2 个 token。
  • 代码和 JSON 由于特殊字符占 token 更多——紧凑写法可节省。
  • 长系统提示开启提示缓存——可节省输入端最多 90% 成本。