【AI】国内token价格排行

AI2小时前发布 beixibaobao
4 0 0

结论先行:目前国内付费 API 里最便宜的是 DeepSeek,而“绝对免费”档则被智谱、腾讯、百度包揽。

但有个大背景你需要知道——2026 年 3 月起,国产大模型的“自杀式”价格战已经正式结束,腾讯云核心模型涨幅 463%,智谱累计涨 83%,阿里百度跟进 5%~34%。所以现在看到的低价,要么是缓存命中的特殊计价,要么是免费但限速的入门模型。


一、按“百万 Token”排行的国内价格天梯(2026 年 5 月)

1. 免费档(0 元,但有限速/QPM 限制)

平台 模型 输入 输出 限制条件
智谱 AI GLM-4-Flash 免费 免费 完全免费,支持微调,适合入门
腾讯 Hunyuan-lite 免费 免费 首次开通赠 100 万 Token/年
百度 ERNIE-Speed 免费 免费 有速率限制,超量需付费

注意:免费模型通常有每分钟请求数(QPM)或并发上限,个人玩可以,跑生产环境或 Agent 流水线会触发限流。


2. 经济档(适合跑量、Agent、RAG 等高频场景)

排名 平台 模型 输入(缓存命中) 输入(未命中) 输出 备注
🥇 DeepSeek V4-Flash 0.02 元 1.0 元 2.0 元 当前国内付费 API 底价
🥈 DeepSeek V4-Pro 0.025 元(2.5 折) 3.0 元(2.5 折) 6.0 元(2.5 折) 优惠截止 5 月 31 日
🥉 智谱 GLM-4-FlashX 0.1 元 0.1 元 0.1 元 不区分输入输出
4 小米 MiMo-V2.5-Flash ≈0.72 元 ≈2.17 元 美元计价,$0.10/$0.30
5 Google Gemini 2.5 Flash-Lite ≈0.72 元 ≈2.90 元 需海外结算,国内访问有门槛
6 字节 豆包 Pro ≈0.8 元 2.0 元 火山引擎,价格已回调
7 阿里 通义 Qwen3.5 0.3 元 0.6 元 部分渠道仍维持低价
8 百度 ERNIE 4.5 Turbo 0.8 元 3.2 元

DeepSeek 的“2 分钱”怎么来的?
这是**缓存命中(Cache Hit)**价格。如果你在做 Agent 或长上下文应用,重复调用的系统提示、RAG 检索结果会被缓存,再次请求时只收 0.02 元/百万 Token。即使缓存未命中,V4-Flash 的 1 元/百万输入也是全国最低的正价。


3. 旗舰档(高性能模型,价格差距极大)

平台 模型 输入 输出
DeepSeek V4-Pro(优惠期) 3 元 6 元
智谱 GLM-4-Plus 5 元 5 元
月之暗面 Kimi K2.5 2~8 元 6~8 元
阿里 Qwen3-Max 6 元 24 元
百度 ERNIE 4.5 4 元 8~16 元
腾讯 Hunyuan-Turbo 3 元 12 元
OpenAI GPT-5.4 ≈18 元 ≈109 元
Anthropic Claude Sonnet 4.6 ≈21 元 ≈108 元

二、关键细节:为什么 DeepSeek 能这么便宜?

  1. 架构优势:DeepSeek V4 系列采用 MoE(混合专家)架构,推理时只激活部分参数,显存和算力消耗远低于 Dense 模型。
  2. 缓存机制:输入缓存命中价已降到首发价的 1/10,对 Agent、代码补全等重复调用场景极度友好。
  3. 限时折扣:V4-Pro 的 2.5 折(输入命中 0.025 元、未命中 3 元、输出 6 元)只到 2026 年 5 月 31 日 23:59,之后恢复原价(输入命中 0.1 元、未命中 12 元、输出 24 元)。

三、实际选型建议

你的场景 推荐选择 理由
个人玩/测试/低并发 智谱 GLM-4-Flash 完全免费,中文能力够用
跑 Agent/大量 RAG/代码补全 DeepSeek V4-Flash 缓存命中 2 分钱,输出也仅 2 元,成本可控
需要推理能力(数学/编程) DeepSeek V4-Pro(趁 5 月底前) 2.5 折后输出 6 元,性能对标 Claude Sonnet
企业合规/央企项目 百度/阿里/腾讯/移动 贵,但过审、备案、私有化部署成熟
海外结算方便/英文场景 Gemini 2.5 Flash-Lite $0.10/百万输入,速度极快

四、避坑提醒

  • “免费”不等于无限:百度 ERNIE-Speed、腾讯 Hunyuan-lite 都有隐形限速,超量后要么拒绝服务,要么自动跳转到高价模型。
  • 移动 Token 套餐不便宜:北京移动 24.99 元/月给 1000 万 Token,折合 2.5 元/百万,比 DeepSeek 贵 100 倍以上,且模型池不透明、有限速。
  • 涨价潮已来:2026 年 Q1 后,除 DeepSeek 外,主流厂商都在回调价格。现在看到的低价窗口(尤其是 DeepSeek 5 月底截止的折扣)建议抓紧锁定。

如果你这个月就要上量,直接冲 DeepSeek V4-Flash 或 V4-Pro(在 5 月 31 日前),是目前国内性价比的绝对最优解。

© 版权声明

相关文章