
Token 收费举例

在模型使用过程中,用户常关注各模型的 Token 计费方式。例如:
-
推理输入:0.6 元 / 百万 tokens
- 含义:向大模型提问、上传文档、粘贴上下文等'给模型看的内容',每消耗 100 万个 tokens,收费 0.6 元。
- 示例:发送一段 1000 字的文章给模型,约 1300 tokens(按 1 字≈1.3 token 粗算)。费用 ≈ 0.6 元 / 1,000,000 × 1,300 ≈ 0.00078 元,几乎可忽略不计。
-
推理输出:3.6 元 / 百万 tokens
- 含义:模型生成的回答、代码、文案等'给你的内容',每消耗 100 万个 tokens,收费 3.6 元。
- 示例:模型生成一篇 1000 字的回答,同样约 1300 tokens。费用 ≈ 3.6 / 1,000,000 × 1,300 ≈ 0.00468 元,比输入贵一些。
Token 的定义与本质
Token 是大语言模型(LLM)处理文本的最小单位,可理解为模型'读'和'写'的'单词/字符/子词'。它是一套贯穿模型训练、推理和部署的核心机制。
1. 本质:文本的数字化编码
- Token 是模型将人类可读的文本(中文、英文、数字、符号等)切分并编码后得到的数字 ID。
- 模型不直接处理'汉字'或'字母',而是处理这些数字 ID。
- 切分规则由模型的**分词器(Tokenizer)**决定,不同模型(如 GPT、Doubao、Claude)的分词规则略有差异。
2. 常见的 Token 类型
- 英文/拉丁语言:通常是子词(Subword),例如
unhappiness会被切分为un,happiness。 - 中文:通常是单字或双字词,例如'我爱中国'可能被切分为
我,爱,中,国或我爱,中国。 - 特殊符号:空格、标点、换行符等也会被编码为独立的 Token。
3. 一个直观的例子
以 Doubao/OpenAI 的分词器为例:
- 输入文本:
Hello, 我是豆包,一个 AI 助手。 - 分词结果(Token):
Hello,,,我,是,豆,包,,,一,个,AI,助,手,。 - 每个 Token 对应一个唯一的数字 ID,例如
Hello→15496,我→ 。


