一招教你免费将DeepSeek、Qwen、Kimi、GLM、mimo等主流ai大模型网页转换成本地api任意调用 彻底实现token自由!
一招教你免费将DeepSeek、Qwen、Kimi、GLM、mimo等主流ai大模型网页转换成本地api任意调用 彻底实现token自由!
关键词:Chat2API教程、DeepSeek本地调用、Qwen本地API、OpenAI兼容接口、本地AI代理、多模型统一管理
| 名称 | 链接 |
|---|---|
| Chat2API客户端 下载 | https://dooo.fun/archives/1644 |

最近在折腾本地 AI 工作流时,遇到一个非常现实的问题:
不同模型平台各有各的 API、鉴权方式和限制,接入成本极高。
直到我发现一个开源工具 —— Chat2API。
它本质上是一个 本地 AI API 网关:
把各家官方 Web AI 平台 → 统一转成 OpenAI 兼容接口。
这意味着什么?
任何支持 OpenAI API 的工具,都能直接用 DeepSeek、Qwen、Kimi、GLM 等模型。
例如:OpenWebUI、Cline、Roo-Code、Cherry Studio 等。
一、Chat2API 是什么?

Chat2API = 本地 AI API 代理 + 多模型统一管理平台
核心思路非常巧妙:
- 不走官方 API 计费
- 直接驱动 各家官方 Web UI
- 本地转为 OpenAI 标准接口
换句话说:
| 传统方式 | Chat2API方式 |
|---|---|
| 每家模型单独接入 | 一次接入全部模型 |
| API 费用高 | 0 成本使用 |
| 接口不统一 | OpenAI 标准统一 |
二、核心功能详解
1️⃣ OpenAI 兼容 API
提供标准接口:
http://localhost:8080/v1/chat/completions
所有支持 OpenAI API 的工具都能直接连接。
例如:
- OpenWebUI
- Cline
- Roo-Code
- Cherry Studio
- Kilo Code
真正实现 即插即用。
2️⃣ 多服务商支持
目前支持的模型渠道非常全面:
| 服务商 | 模型 |
|---|---|
| DeepSeek | DeepSeek-V3.2 |
| GLM | GLM-5 |
| Kimi | kimi-k2.5 |
| MiniMax | MiniMax-M2.5 |
| Perplexity | Sonar / Deep Research |
| Qwen(国内) | Qwen3系列 |
| Qwen(国际) | Qwen-VL / Turbo |
| Z.ai | GLM 系列 |
基本覆盖主流大模型生态。
3️⃣ 上下文管理(重要)
这是很多代理工具没有的功能:
支持:
- 滑动窗口
- Token 限制
- 自动总结压缩
作用:
避免上下文爆炸导致的对话丢失或费用增加。
4️⃣ 工具调用支持(Function Call)
通过提示词工程实现:
- 通用 Tool Call 能力
- 兼容 Cherry Studio / Kilo Code
这意味着:
即使模型不原生支持 Function Call,也能模拟实现。
5️⃣ 模型映射(非常实用)
支持:
- 模型名称通配符
- 首选服务商策略
- 多账户切换
例如:
gpt-4 -> DeepSeek
gpt-3.5 -> Qwen
客户端完全无感。
6️⃣ 自定义 Header(高级玩法)
可以开启:
- 联网搜索
- 深度思考
- 深度研究模式
属于进阶功能。
7️⃣ 仪表盘监控
可视化查看:
- 请求量
- Token 使用
- 成功率
- 请求日志
对于排查问题非常关键。
三、下载安装
| 名称 | 链接 |
|---|---|
| Chat2API客户端 下载 | https://dooo.fun/archives/1644 |
四、详细使用教程
步骤1:启动应用
安装后打开 Chat2API,进入主仪表盘。
步骤2:添加模型供应商
进入 供应商页面 → 添加供应商
以 DeepSeek 为例:

获取 DeepSeek Token
- 打开
https://chat.deepseek.com/ - 随便发送一句话
- 按 F12
- 打开:
Application → Local Storage
找到:
userToken
复制即可。
然后填入 Chat2API。
步骤3:启动本地代理
进入 代理设置
推荐配置:
| 项目 | 建议 |
|---|---|
| 端口 | 8080 |
| 负载均衡 | 轮询 |
| 故障策略 | 自动切换 |
点击 启动代理
当看到运行成功,说明:
本地 OpenAI API 已上线
五、如何接入 OpenWebUI / Cline
填写 OpenAI 接口:
Base URL:
http://localhost:8080/v1
API KEY:
随便填
此时你会发现:
👉 已经可以直接使用 DeepSeek / Qwen。
客户端会以为你在用 OpenAI。
六、适合哪些人使用?
特别适合:
- AI 开发者
- 前端工程师
- AI 工作流玩家
- 本地部署爱好者
- 想统一管理多个模型的人
七、总结
Chat2API 本质解决了一个关键痛点:
多模型接入成本过高
它做的事情可以总结为:
- 本地代理
- 统一接口
- 多模型聚合
- 零成本使用
如果你正在搭建 AI 工作流,这是非常值得尝试的工具。