【AI】国内token价格排行

结论先行：目前国内付费 API 里最便宜的是 DeepSeek，而“绝对免费”档则被智谱、腾讯、百度包揽。

但有个大背景你需要知道——2026 年 3 月起，国产大模型的“自杀式”价格战已经正式结束，腾讯云核心模型涨幅 463%，智谱累计涨 83%，阿里百度跟进 5%~34%。所以现在看到的低价，要么是缓存命中的特殊计价，要么是免费但限速的入门模型。

一、按“百万 Token”排行的国内价格天梯（2026 年 5 月）

1. 免费档（0 元，但有限速/QPM 限制）

平台	模型	输入	输出	限制条件
智谱 AI	GLM-4-Flash	免费	免费	完全免费，支持微调，适合入门
腾讯	Hunyuan-lite	免费	免费	首次开通赠 100 万 Token/年
百度	ERNIE-Speed	免费	免费	有速率限制，超量需付费

注意：免费模型通常有每分钟请求数（QPM）或并发上限，个人玩可以，跑生产环境或 Agent 流水线会触发限流。

2. 经济档（适合跑量、Agent、RAG 等高频场景）

排名	平台	模型	输入（缓存命中）	输入（未命中）	输出	备注
🥇	DeepSeek	V4-Flash	0.02 元	1.0 元	2.0 元	当前国内付费 API 底价
🥈	DeepSeek	V4-Pro	0.025 元（2.5 折）	3.0 元（2.5 折）	6.0 元（2.5 折）	优惠截止 5 月 31 日
🥉	智谱	GLM-4-FlashX	0.1 元	0.1 元	0.1 元	不区分输入输出
4	小米	MiMo-V2.5-Flash	≈0.72 元	—	≈2.17 元	美元计价，$0.10/$0.30
5	Google	Gemini 2.5 Flash-Lite	≈0.72 元	—	≈2.90 元	需海外结算，国内访问有门槛
6	字节	豆包 Pro	≈0.8 元	—	2.0 元	火山引擎，价格已回调
7	阿里	通义 Qwen3.5	0.3 元	—	0.6 元	部分渠道仍维持低价
8	百度	ERNIE 4.5 Turbo	0.8 元	—	3.2 元	—

DeepSeek 的“2 分钱”怎么来的？
这是**缓存命中（Cache Hit）**价格。如果你在做 Agent 或长上下文应用，重复调用的系统提示、RAG 检索结果会被缓存，再次请求时只收 0.02 元/百万 Token。即使缓存未命中，V4-Flash 的 1 元/百万输入也是全国最低的正价。

3. 旗舰档（高性能模型，价格差距极大）

平台	模型	输入	输出
DeepSeek	V4-Pro（优惠期）	3 元	6 元
智谱	GLM-4-Plus	5 元	5 元
月之暗面	Kimi K2.5	2~8 元	6~8 元
阿里	Qwen3-Max	6 元	24 元
百度	ERNIE 4.5	4 元	8~16 元
腾讯	Hunyuan-Turbo	3 元	12 元
OpenAI	GPT-5.4	≈18 元	≈109 元
Anthropic	Claude Sonnet 4.6	≈21 元	≈108 元

二、关键细节：为什么 DeepSeek 能这么便宜？

架构优势：DeepSeek V4 系列采用 MoE（混合专家）架构，推理时只激活部分参数，显存和算力消耗远低于 Dense 模型。
缓存机制：输入缓存命中价已降到首发价的 1/10，对 Agent、代码补全等重复调用场景极度友好。
限时折扣：V4-Pro 的 2.5 折（输入命中 0.025 元、未命中 3 元、输出 6 元）只到 2026 年 5 月 31 日 23:59，之后恢复原价（输入命中 0.1 元、未命中 12 元、输出 24 元）。

三、实际选型建议

你的场景	推荐选择	理由
个人玩/测试/低并发	智谱 GLM-4-Flash	完全免费，中文能力够用
跑 Agent/大量 RAG/代码补全	DeepSeek V4-Flash	缓存命中 2 分钱，输出也仅 2 元，成本可控
需要推理能力（数学/编程）	DeepSeek V4-Pro（趁 5 月底前）	2.5 折后输出 6 元，性能对标 Claude Sonnet
企业合规/央企项目	百度/阿里/腾讯/移动	贵，但过审、备案、私有化部署成熟
海外结算方便/英文场景	Gemini 2.5 Flash-Lite	$0.10/百万输入，速度极快

四、避坑提醒

“免费”不等于无限：百度 ERNIE-Speed、腾讯 Hunyuan-lite 都有隐形限速，超量后要么拒绝服务，要么自动跳转到高价模型。
移动 Token 套餐不便宜：北京移动 24.99 元/月给 1000 万 Token，折合 2.5 元/百万，比 DeepSeek 贵 100 倍以上，且模型池不透明、有限速。
涨价潮已来：2026 年 Q1 后，除 DeepSeek 外，主流厂商都在回调价格。现在看到的低价窗口（尤其是 DeepSeek 5 月底截止的折扣）建议抓紧锁定。

如果你这个月就要上量，直接冲 DeepSeek V4-Flash 或 V4-Pro（在 5 月 31 日前），是目前国内性价比的绝对最优解。