统一入口 · 多模型路由 · 透明计费

DMGateway使用说明

适合：开发者、管理员、团队成员阅读时间：约 25 分钟更新：2026-05-14

这份图文文档帮助你完成从注册、充值、创建令牌，到使用 CC-Switch、Claude Code、Codex CLI、Gemini CLI、Cursor、OpenAI SDK 以及绘图模型的全流程接入；并提供桌面客户端进阶玩法、常见问题和服务条款建议，方便企业或个人快速上手 AI API 网关。

5 分钟接入使用 CC-Switch

客户端请求经过DMGateway路由到多个模型供应商的示意图 — 统一入口负责认证、限流、计费和模型路由，业务代码只需要维护一套调用配置。

文档目录

建议第一次接入时从注册流程开始按顺序阅读；如果只想接入某一个客户端，可以直接跳到对应章节。

新手路径 注册、登录、充值、令牌、环境检查、CLI 工具选型。 CC-Switch 桌面端 用 GUI 一次性管好 Claude Code、Codex、Gemini 配置。 CLI 手动配置 不用 CC-Switch，直接编辑 settings.json / config.toml / .env。 绘图模型 Banana 系列、GPT-Image 系列接入与参数说明。 桌面端进阶 Claude Desktop、AionUI、OpenCode、OpenClaw 等。 排障 FAQ Claude Code、Codex、Gemini 常见报错与处理。

基础地址 https://gateway.di-matrix.ai 正式部署时请替换为你自己的DMGateway域名；本文以 gateway.di-matrix.ai 作为占位。

控制台总览

登录控制台之后，左侧会出现「钱包管理」「令牌管理」「模型广场」「账单/日志」等入口；右上角通常会显示余额和当前生效的分组。

DMGateway控制台概览示意图 — 原创示意图，仅展示功能区结构。实际界面以你的部署版本为准。

钱包管理：充值、查看消费、申请发票。
令牌管理：创建、停用、调整额度和分组。
模型广场：按分组查看可用模型、倍率、上下文长度。
账单 / 日志：定位单次请求的耗时、token 数和扣费。

快速开始

从注册到完成第一次调用一般只需要 5 分钟，整体流程是：

注册并登录

使用 Google 一键登录或邮箱注册，写入会话后跳转到控制台。

充值并获取额度

在「钱包管理」选择金额、是否需要发票，完成支付即时到账。

创建令牌

在「令牌管理」按用途选择分组，记下生成的 sk- 开头的密钥。

客户端接入

用 CC-Switch 一键配置，或把 Base URL、API Key 写入 CLI 的配置文件。

注册账户

访问DMGateway的注册地址（一般是 https://gateway.di-matrix.ai/register），可以选择 Google 一键授权或邮箱注册两种方式。

注册流程示意图：登录页 → 授权 / 校验 → 控制台 — 无论选择哪一种方式，目标都是写入会话 Cookie 之后跳转到控制台。

方式一 · Google 授权（推荐）

在登录页点击「使用 Google 继续」按钮。
在弹出的 Google 账户选择窗口中挑选一个账户并授权。
授权完成后系统自动创建账号并跳转到控制台，无需额外设置密码。

方式二 · 邮箱注册

点击登录页底部的「没有账号？立即注册」。
填写邮箱、用户名和密码，密码建议字母 + 数字 + 特殊字符。
按提示完成邮箱验证或验证码校验，提交后即可使用。

提示邮箱既用于校验，也是接收账单和服务通知的渠道，建议使用个人长期可用的邮箱。

登录账号

登录入口与注册同址，输入完成后浏览器会保持会话，下次访问无需再次输入密码；切换设备需要重新登录。

常见登录方式

Google 登录：点击「使用 Google 继续」，选择已注册过的 Google 账号即可。
邮箱 / 用户名 + 密码：依次输入账号和密码，点击「继续」。

登录失败的处理

若提示「OIDC token 获取失败」「会话过期」，多半是浏览器缓存或 Cookie 异常，按以下步骤清理后重试：

Windows / Linux Chrome：Ctrl + Shift + Delete 打开清理面板，勾选 Cookie 与缓存后清除。
macOS Chrome：Command + Shift + Delete 同样可打开清理面板。
仍异常时，按 F12 打开开发者工具 → Application → Storage → Cookies → 选择当前域名 → 删除 session 与登录相关 Cookie，刷新后重新登录。

充值与开票

登录控制台后进入左侧「钱包管理」，按以下三步完成充值。

选择金额

选用预设档位（如 50 / 100 / 500 元）或自定义金额，最低限额以页面提示为准。

是否开票

不需要发票直接选「无需发票」；需要中国大陆增值税电子普通发票时勾选「大陆发票」并填写抬头与税号。

确认支付

核对底部「实际支付金额」后点击「立即支付」，按支付宝 / 微信支付提示完成扫码或跳转。

额度换算

常见的换算关系是 1 元人民币 = 1 美元额度，最终以页面显示为准。请求是否成功扣费、是否退款均可在「账单」中查看明细。

支付页打不开 若使用支付宝或微信支付时支付页一直加载不出，请先关闭 VPN / 系统代理或开启分流，让支付域名直连后再次尝试。

创建 API 令牌

令牌是访问DMGateway的凭证。建议按用途、环境或团队成员各创建一支，方便审计、停用和差异化额度。

创建令牌的表单与分组示意图 — 名称用于在日志中识别用途；分组直接决定能调用哪些模型。

创建步骤

登录控制台后进入「令牌管理」。
点击页面顶部「添加令牌」，会弹出新建表单。
填写名称（建议体现用途，例如 claude-code、codex、gemini）。
选择令牌分组，决定可用模型与计费倍率（详见下文「令牌分组」）。
设置过期时间，默认「永不过期」即可。
数量保持 1，确认是否「不限额度」。
新手不建议开启模型限制和 IP 白名单，等接通后再按需收紧。
点击提交，把生成的 sk- 开头密钥复制到本地保存。

关键提醒 分组选错最常见的报错是「模型不存在」。请按目标客户端选择对应分组，例如 Claude Code 选 CC 分组、Codex 选 codex 分组、Gemini 选 gemini 分组。

密钥管理建议

生产密钥不要写进前端代码或公开仓库。
测试密钥设置较小额度和较短有效期。
泄露后立即在控制台禁用旧密钥，并创建新密钥。
团队成员尽量持有独立令牌，便于通过日志追溯调用来源。

环境检查

开始配置前先确认网络、客户端和密钥状态，能解决大部分「连接失败」「模型不可用」类问题。

网络连通

本机可访问DMGateway域名，公司或代理软件没有拦截 HTTPS 流量；图像生成等长请求建议加入直连白名单。

客户端版本

IDE / CLI / SDK 版本支持自定义 Base URL 和 Bearer Token；Cline、Roo Code 等需 VSCode ≥ 1.80。

账户与令牌

账户余额充足，令牌未过期；目标模型在令牌分组的可用范围内。

Node.js 验证

大多数 CLI 工具依赖 Node.js 与 npm。任意终端中执行：

npm list -g --depth-0

没有报错即说明 Node.js 与 npm 可用，列表为空也没关系。如果提示 command not found，先安装 Node.js（建议 LTS 版本）后再继续。

CLI 选择

DMGateway对外提供两个常用 API 入口：

主入口

https://gateway.di-matrix.ai，对应稳定生产环境。OpenAI 兼容客户端在末尾追加 /v1。

优化线路

https://gateway.di-matrix.ai，针对延迟敏感场景启用更激进的负载均衡。

选择策略

普通使用建议主入口；遇到长尾延迟、丢包或部分模型不稳定时切到优化线路。

具体客户端有两条接入路径：

CC-Switch 桌面端 / CLI（推荐）：图形界面或终端命令，一键管理 Claude Code、Codex、Gemini 配置，不用手写 JSON / TOML。
CLI 手动配置：直接编辑 ~/.claude/settings.json、~/.codex/config.toml、~/.gemini/.env 等文件，适合对配置有完全掌控需求的开发者。

模型广场

控制台右上角的「模型广场」展示可用模型、所属分组、计费倍率和上下文长度。第一次使用建议先在这里挑选模型并复制准确的模型名。

模型	所属分组	建议场景
`gpt-4o-mini`	Default / Codex	客服、摘要、轻量代理
`claude-sonnet-4`	CC / Claude	代码、长文档、规划
`claude-opus-4.5`	claude-officially	超长上下文、深度推理
`gemini-2.5-pro`	Gemini / gemini-slb	多模态、知识检索
`gpt-image-2`	sora	文生图、图像编辑

避免抄错模型名 模型名区分大小写和后缀（例如 [1m] 表示 1M 上下文），尽量从模型广场点击复制按钮拷贝。

令牌分组

分组让令牌只能调用一组模型，并对应一个计费倍率。新建令牌时选错分组就会出现「模型不存在」「权限不足」。

倍率含义

低于 1 倍：折扣，例如 ×0.5 等同于 5 折，×0.8 等同于 8 折。
等于 1 倍：原价。
高于 1 倍：加价，例如 ×1.5 表示在原价基础上加收 50%。

常见分组

分组	覆盖模型	典型用途
`Default`	通用聊天模型	未指定分组时的兜底
`CC`	Claude 系列（Anthropic 协议）	Claude Code、Claude Desktop
`Codex`	GPT 代码 / 通用模型	Codex CLI、IDE 代码助手
`Gemini` / `gemini-slb`	Gemini 系列	Gemini CLI、Roo Code
`aws` / `aws-q`	AWS Bedrock 上的 Claude	对接 AWS 通道时优先选用
`azure`	Azure OpenAI	需要走 Azure 通道时
`claude-officially` / `claude-sale`	Anthropic 官方通道	对延迟和稳定性要求高时
`doubao` / `pplx` / `deepseek-officially`	豆包、Perplexity、DeepSeek 等	多模型对比、特定厂商专项
`sora`	图像 / 视频生成	GPT-Image、Banana 等绘图模型

具体可用分组以控制台「模型广场 → 可用分组」显示为准；管理员可定制更多分组并配置倍率。

CC-Switch · 通用步骤

CC-Switch 是一个跨平台桌面工具，用 GUI 集中管理 Claude Code、Codex、Gemini 的供应商、模型和 MCP 服务，省去手写配置文件。

CC-Switch 桌面端的分组、供应商、激活三栏布局 — 左侧选择分组 → 中间填写供应商 → 右侧激活，是几乎所有客户端的统一流程。

安装

Windows：
- CC-Switch-v3.15.0-Windows.msi（安装版，推荐）
- CC-Switch-v3.15.0-Windows-Portable.zip（便携版）
macOS：
- CC-Switch-v3.15.0-macOS.dmg（推荐）
- 或使用 Homebrew：
```
brew tap farion1231/ccswitch
brew install --cask cc-switch
```
Linux x86_64：
- CC-Switch-v3.15.0-Linux-x86_64.deb（Debian / Ubuntu）
- CC-Switch-v3.15.0-Linux-x86_64.rpm（Fedora / RHEL）
- CC-Switch-v3.15.0-Linux-x86_64.AppImage（通用）
Linux arm64：
- CC-Switch-v3.15.0-Linux-arm64.deb
- CC-Switch-v3.15.0-Linux-arm64.AppImage

所有版本均可在 GitHub Releases 页面找到。

核心能力

不同供应商之间快速切换。
预置DMGateway模板，避免漏填字段。
统一管理 MCP（Model Context Protocol）服务、系统提示词、Skills 扩展。
系统托盘快捷入口。
当前主线版本基于 Tauri 2，支持 Windows / macOS / Linux。

Claude Code 配置（CC-Switch）

启动 CC-Switch，进入主界面。
在分组栏选择 Claude。
供应商下拉选择「自定义」，填写以下字段：
- 请求地址：https://docgateway.di-matrix.ai（注意：请求地址与控制台登录地址不同）
- API 格式：Anthropic 原生
到DMGateway控制台「令牌管理」按 CC 分组创建令牌，复制密钥。
把密钥粘贴到 API Key 字段，点击「添加」。
在主界面对应供应商点「启用」，状态变为「使用中」即生效。
在「设置」中勾选「跳过 Claude Code 初次确认」。
终端执行 claude，能正常进入对话即代表配置完成。

注意 CC 分组在 CC-Switch 中可能不支持「调用测试」。请直接在 Claude Code 中实际发送一条消息验证。

Codex 配置（CC-Switch）

启动 CC-Switch，分组栏切换到 Codex。
供应商下拉选择「自定义」，填写以下字段：
- 请求地址：https://docgateway.di-matrix.ai
- API 格式：OpenAI Responses API
到DMGateway控制台创建 codex 分组的令牌并复制密钥。
粘贴 API Key，点右下角「添加」。
回到主界面，点击右侧「启用」，状态显示「使用中」。
终端执行 codex，进入聊天界面即说明配置成功。

Gemini 配置（CC-Switch）

启动 CC-Switch，分组栏切到 Gemini。
供应商选择「自定义」，填写以下字段：
- 请求地址：https://docgateway.di-matrix.ai
- API 格式：Google Gemini
控制台创建 Gemini 或 gemini-slb 分组的令牌。
把 API Key 粘贴到表单，点「添加」。
主界面「启用」对应分组，状态为「使用中」。
终端执行 gemini，能进入对话即说明完成。

CC-Switch CLI

CC-Switch CLI 是 CC-Switch 的命令行版本，适合服务器、远程开发场景，能管理供应商、MCP、Skills、提示词。

安装

# macOS（universal）
curl -LO https://github.com/saladday/cc-switch-cli/releases/latest/download/cc-switch-cli-darwin-universal.tar.gz
tar -xzf cc-switch-cli-darwin-universal.tar.gz
chmod +x cc-switch
sudo mv cc-switch /usr/local/bin/

# Linux x64-musl
curl -LO https://github.com/saladday/cc-switch-cli/releases/latest/download/cc-switch-cli-linux-x64-musl.tar.gz
tar -xzf cc-switch-cli-linux-x64-musl.tar.gz
chmod +x cc-switch
sudo mv cc-switch /usr/local/bin/

# Windows：下载对应 zip，把 cc-switch.exe 加入 PATH

常用命令

cc-switch provider list           # 查看供应商
cc-switch provider switch <id>    # 切换供应商
cc-switch mcp sync                # 同步 MCP 服务器
cc-switch mcp add                 # 新增 MCP
cc-switch prompts list            # 查看提示词
cc-switch prompts activate <id>   # 激活提示词
cc-switch skills install <name>   # 安装 Skill
cc-switch skills sync             # 同步 Skill
cc-switch config backup           # 备份配置
cc-switch config restore          # 恢复配置

添加DMGateway供应商

执行 cc-switch 进入 TUI。
选择 Providers，按 a 新增。
选择「自定义」。
填写 API Key 字段。
按 Ctrl+S 保存，确认列表中已选中新供应商后退出。

CLI 手动配置 · 环境与安装

不想用 CC-Switch 的同学可以直接安装并配置三大 CLI，整体只有三步：验证 Node.js、安装命令行、首次启动生成配置目录。

1. 确认 Node.js

npm list -g --depth-0

若提示找不到命令请先安装 Node.js（建议 LTS）后再继续。

2. 安装三个 CLI

工具	安装命令	系统要求
Claude Code	`npm i -g @anthropic-ai/claude-code@latest`	Node.js ≥ 18，macOS / Linux / Windows（WSL）
Codex CLI	`npm i -g @openai/codex@latest`	Node.js ≥ 22
Gemini CLI	`npm i -g @google/gemini-cli@latest`	Node.js ≥ 18

npm i -g @anthropic-ai/claude-code@latest
npm i -g @openai/codex@latest
npm i -g @google/gemini-cli@latest

Windows 用户 Claude Code 在 Windows 上需要通过 WSL（Windows Subsystem for Linux）运行。Codex CLI 和 Gemini CLI 支持原生 Windows PowerShell / CMD。

3. 首次启动生成配置目录

claude   # 第一次启动 Claude Code
codex    # 第一次启动 Codex CLI
gemini   # 第一次启动 Gemini CLI

每个工具首次运行都会在用户目录下创建配置文件夹（~/.claude、~/.codex、~/.gemini），后续手动配置都基于这些目录。

三大 CLI 的配置文件结构示意图 — 不同 CLI 各自有独立目录与配置格式：JSON、TOML、.env。

Claude Code · 手动配置

Windows

按 Win+R 输入 %userprofile%\.claude 打开配置目录。
新建或打开 settings.json，写入下方模板。
把 xxx 替换为 CC 分组的 API Key。
终端执行 claude 验证。

macOS

在 Finder 按 Command+Shift+G，输入 ~/.claude 打开目录。
新建或编辑 settings.json，使用同样的内容。
替换密钥并执行 claude。

~/.claude/settings.json

{
  "env": {
    "ANTHROPIC_BASE_URL": "https://gateway.di-matrix.ai",
    "ANTHROPIC_AUTH_TOKEN": "xxx",
    "CLAUDE_CODE_ATTRIBUTION_HEADER": "0",
    "CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": "1",
    "CLAUDE_CODE_DISABLE_TERMINAL_TITLE": "1"
  }
}

ANTHROPIC_BASE_URL：DMGateway根地址。
ANTHROPIC_AUTH_TOKEN：CC 分组的 API Key。
其它三个开关用于减少与官方服务的非必要握手与流量，避免「无法连接 Anthropic 服务」类提示。

如果首次运行仍提示需要登录，请到 Claude Code FAQ 中按系统执行一次 onboarding 标记修复。

Codex CLI · 手动配置

Windows

按 Win+R 输入 %userprofile%\.codex 打开配置目录。
确保存在三个文件，缺则新建：config.toml（核心配置）、auth.json（密钥）、AGENTS.md（全局系统提示）。
把下方 config.toml 模板写入 config.toml。
把密钥写入 auth.json。
终端执行 codex 验证。

macOS

在 Finder 按 Command+Shift+G，输入 ~/.codex。
同样的三个文件结构，按 macOS 模板写入 config.toml。
替换密钥后执行 codex。

~/.codex/config.toml（Windows）

disable_response_storage = true
model = "gpt-5.2"
model_provider = "gateway"
model_reasoning_effort = "xhigh"
model_verbosity = "high"

[features]
web_search_request = true

[model_providers.gateway]
base_url = "https://gateway.di-matrix.ai/v1"
name = "gateway"
requires_openai_auth = true
wire_api = "responses"

~/.codex/config.toml（macOS）

model_provider = "gateway"
model = "gpt-5.1-codex"
model_reasoning_effort = "high"
network_access = "enabled"
disable_response_storage = true
windows_wsl_setup_acknowledged = true
model_verbosity = "high"

[model_providers.gateway]
name = "gateway"
base_url = "https://gateway.di-matrix.ai/v1"
wire_api = "responses"
requires_openai_auth = true

~/.codex/auth.json

{
  "OPENAI_API_KEY": "sk-your-api-key"
}

AGENTS.md 用于设定 Codex 在所有项目中共享的系统提示，例如「使用中文回答」「不要修改超过 2 个文件」「输出统一带 token 计数」等。

Gemini CLI · 手动配置

Windows

按 Win+R 输入 %userprofile%\.gemini。
新建或编辑 .env 文件，加入下方变量。
替换 xxx 为 Gemini 分组的 API Key。
终端执行 gemini 验证。

macOS

Finder 按 Command+Shift+G，输入 ~/.gemini。
编辑同样的 .env 文件并保存。
替换密钥后执行 gemini。

~/.gemini/.env

GOOGLE_GEMINI_BASE_URL=https://gateway.di-matrix.ai
GEMINI_API_KEY=sk-your-api-key
GEMINI_MODEL=gemini-2.5-pro

如使用 gemini-3-pro-preview 等新模型，可以把 GEMINI_MODEL 改为对应名称；命令启动时会自动应用。

Cursor

在 Cursor 设置 → Models → OpenAI Compatible Provider，启用并填写DMGateway地址和密钥。

Base URL: https://gateway.di-matrix.ai/v1
API Key:  sk-your-api-key
Model:    gpt-4o-mini

如需使用 Claude 系列模型，可在 Cursor 模型列表里手动添加 claude-sonnet-4、claude-opus-4.5 等模型名；Cursor 仍按 OpenAI 兼容协议向DMGateway发起请求，由DMGateway完成协议转换。

VSCode 插件

VSCode 生态中有多款 AI 编程插件支持自定义 OpenAI 兼容接口，只需填入网关地址和令牌即可接入。

Claude Code 插件（官方）

Anthropic 官方提供的 VSCode 插件，将 Claude Code 的能力直接嵌入编辑器侧边栏，无需切换终端。

VSCode 扩展市场搜索 Claude Code（发布者 Anthropic）并安装。
插件复用 ~/.claude/settings.json 中的网关配置，无需单独填写地址。若尚未配置，请先按「CLI 手动配置 → Claude Code」章节完成设置。
安装后重启 VSCode，侧边栏出现 Claude 图标即代表生效。
若插件仍提示登录，在 ~/.claude 目录下编辑 config.json，加入以下字段后重启 VSCode：
```
{ "primaryApiKey": "Gateway" }
```

Cline

Cline 是功能完整的 AI 编程助手，支持文件读写、终端执行、浏览器操作等 Agent 能力。

VSCode 扩展市场搜索 Cline 并安装。
打开 Cline 侧边栏 → 点击右上角设置图标。

API Provider 选择 OpenAI Compatible，填写：

Base URL: https://gateway.di-matrix.ai/v1
API Key:  sk-your-api-key
Model:    claude-sonnet-4

点击「Save」，在对话框发送一条消息验证。

Roo Code

Roo Code 是 Cline 的社区分支，界面和配置方式基本相同，额外支持更多模型格式选项。

VSCode 扩展市场搜索 Roo Code 并安装。
打开 Roo Code 侧边栏 → 设置。

Provider 选 OpenAI Compatible，请求格式建议选 OpenAI Response，填写：

Base URL: https://gateway.di-matrix.ai/v1
API Key:  sk-your-api-key
Model:    claude-sonnet-4

Continue

Continue 支持代码补全与对话两种模式，配置文件为 ~/.continue/config.json。

VSCode 扩展市场搜索 Continue 并安装。
打开 Continue 侧边栏 → 点击右下角配置图标，编辑 config.json，在 models 数组中添加：

{
  "title": "DMGateway",
  "provider": "openai",
  "model": "claude-sonnet-4",
  "apiKey": "sk-your-api-key",
  "apiBase": "https://gateway.di-matrix.ai/v1"
}

保存后 Continue 自动重载，在模型下拉中选择 DMGateway 即可使用。

令牌分组 调用 Claude 系列模型时使用 CC 分组令牌；调用 GPT 系列时使用 codex 分组令牌；调用 Gemini 系列时使用 Gemini 分组令牌。

OpenAI SDK

所有兼容 OpenAI Chat Completions 的客户端都可以用同一方式接入。

Node.js

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.NEW_API_KEY,
  baseURL: "https://gateway.di-matrix.ai/v1",
});

const response = await client.chat.completions.create({
  model: "gpt-4o-mini",
  messages: [{ role: "user", content: "用一句话介绍DMGateway" }],
});

console.log(response.choices[0].message.content);

Python

from openai import OpenAI

client = OpenAI(
    api_key="sk-your-api-key",
    base_url="https://gateway.di-matrix.ai/v1",
)

resp = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": "用一句话介绍DMGateway"}],
)
print(resp.choices[0].message.content)

兼容 One API

已有 One API / OpenAI 兼容代码时，通常只需把 baseURL 与密钥换成DMGateway对应字段即可，其他业务代码保持不变。

curl https://gateway.di-matrix.ai/v1/models \
  -H "Authorization: Bearer sk-your-api-key"

响应中会列出令牌分组下的所有可用模型；常用于自动同步前端模型下拉。

聊天补全

推荐使用 /v1/chat/completions。请求体遵循 OpenAI 兼容格式，并支持流式输出。

curl https://gateway.di-matrix.ai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-your-api-key" \
  -d '{
    "model": "gpt-4o-mini",
    "messages": [
      { "role": "user", "content": "写一个 HTTP 重试策略" }
    ]
  }'

对于 Anthropic 原生协议的 Claude 调用，可使用 /v1/messages；Codex CLI 默认使用 /v1/responses，由网关在内部转换。

图像与文件

多模态模型可接收图片 URL 或上传文件。请确认目标渠道支持对应输入：

image_url：通过 URL 引用，要求模型可访问该地址。
image_base64：直接把图片 base64 写入 content。
file_id：先调用 /v1/files 上传文件再引用 ID（部分模型可用）。

文生图与图像编辑请参考绘图模型章节。

流式响应

设置 stream: true 可启用 SSE 流式返回，适合聊天、IDE 和长文本生成场景。

{
  "model": "gpt-4o-mini",
  "stream": true,
  "messages": [{ "role": "user", "content": "逐步解释 Redis 限流" }]
}

返回数据是按 data: 行的 SSE 流，最后以 data: [DONE] 结束。客户端建议保留心跳超时（30s）并在断流时重试。

错误码

状态码	含义	处理建议
400	请求参数错误	检查模型名、参数类型，尤其 `messages` 结构
401	密钥无效或缺失	检查 Authorization Header、Bearer 前缀
403	账户 / 分组无权访问该模型	更换分组或确认计费状态后重试
404	模型不存在或路径写错	到模型广场复制准确名称，确认 Base URL 是否带 `/v1`
429	频率或额度受限	降低并发或提升配额；图像类请求增加重试间隔
500 / 502 / 503	上游渠道异常	稍后重试或切换至其它分组 / 优化线路

Banana 系列绘图

Banana 2 Pro 是网关侧封装好的图像生成模型，常通过 Cherry Studio 等桌面客户端使用。

图像生成请求经过 /v1/images/* 接口路由到上游绘图模型 — 图像类请求建议加大超时阈值，并把网关域名加入直连白名单，避免代理截断。

前置准备

到控制台「令牌管理」创建 Gemini 分组的令牌（Banana 系列在该分组中）。
下载 Cherry Studio 官方版本并安装。

Cherry Studio 接入

打开设置 → 模型服务 → 添加。
提供商名称：gateway-banana；类型选择适合图像生成的选项。
API Key：填入 Gemini 分组的令牌密钥。
API 地址：https://gateway.di-matrix.ai。
在模型管理中选择已预置的「常见比例 / 分辨率」绘图模型。
关闭模型设置中的「流式输出」（重要），否则可能无法返回图像。
从模型下拉中选中绘图模型，输入提示词即可开始生成。

GPT-Image 系列绘图

gpt-image-2 属于 sora 分组，使用前请创建该分组令牌。推荐通过 OpenAI 兼容的 Images API 调用。

调用接口

文生图：POST https://gateway.di-matrix.ai/v1/images/generations
图像编辑 / 变体：POST https://gateway.di-matrix.ai/v1/images/edits

示例请求

curl --location 'https://gateway.di-matrix.ai/v1/images/generations' \
  --header 'Authorization: Bearer sk-your-sora-key' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "gpt-image-2",
    "prompt": "橘猫披着围巾抱着水獭，温暖插画风",
    "size": "3840x2160",
    "quality": "high",
    "n": 1
  }'

关键参数

参数	取值	说明
`model`	`gpt-image-2`	固定值
`prompt`	字符串	建议描述主体、场景、风格、画幅比例
`n`	`1`	当前仅支持单张
`size`	1024×1024 / 1536×1024 / 3840×2160 等	宽高均需为 16 的倍数；总像素 655 360 ~ 8 294 400；最长边 ≤ 3840；最大宽高比 3:1
`quality`	`low` / `medium` / `high` / `auto`	质量越高耗时越长
`response_format`	`url`（推荐）/ `b64_json`	URL 形式更易调试
`output_format`	`png` / `jpeg`	需要透明通道用 png

不支持的方式

Responses API 不支持图像生成参数。
Chat Completions 接口的 image 字段不会被解析为绘图设置，只能用 Images API。

易超时 图像生成单次请求可能持续 30~90 秒，请适当调高客户端超时；将 gateway.di-matrix.ai 加入代理白名单，避免被截断。

Claude Desktop

Claude Desktop 提供桌面级聊天界面，可以通过开发者模式接入第三方推理后端。

桌面客户端通过统一 Base URL 与 API Key 接入网关示意图 — 桌面端的核心字段是 Base URL、API Key、API Format 三项，模型名从模型广场复制即可。

下载安装

到 Claude 官网下载页选择对应系统的安装包。
Windows：在安装包目录打开命令提示符，先设置代理（示例端口 7897）再启动安装：
```
set HTTP_PROXY=http://127.0.0.1:7897
set HTTPS_PROXY=http://127.0.0.1:7897
"Claude Setup.exe"
```
macOS：双击 dmg 直接安装，无需代理。

开启开发者模式

Windows：点击邮箱输入框，按 Tab 进入菜单，Help → Troubleshooting → Enable developer mode。
macOS：直接通过菜单栏 Help → Troubleshooting → Enable developer mode。

填写第三方推理端点

打开菜单 Developer → Configure third-party inference。
Gateway base URL：https://gateway.di-matrix.ai。
Gateway API key：CC 分组的令牌密钥。
勾选「Skip login-mode chooser」。
点击「Apply locally」保存。

AionUI

AionUI 是统一的 GUI 客户端，可同时管理 Claude Code、Codex、Gemini CLI 三类后端，适合不熟悉终端的用户。

安装

Windows：到 GitHub Releases 下载 .exe 安装。
macOS：brew install aionui，或下载 .dmg / .zip（兼容 Intel 与 Apple Silicon）。

Linux：

wget https://github.com/iOfficeAI/AionUi/releases/latest/download/AionUi-x.x.x-linux-amd64.deb
sudo dpkg -i AionUi-x.x.x-linux-amd64.deb

分别配置三类模型

到DMGateway创建对应分组的令牌：Gemini → Gemini，Claude → CC，Codex → codex。
打开 AionUI → 设置 → LLM Configuration → Add Model。
平台选「Custom」，填写 API Key、Endpoint 和模型。

模型	Endpoint	分组
Gemini	`https://gateway.di-matrix.ai`	Gemini
Claude	`https://gateway.di-matrix.ai`	CC
Codex	`https://gateway.di-matrix.ai/v1`	codex

OpenCode

OpenCode 是开源的 AI 编程助手，支持终端、IDE 与桌面端协同。

安装

npm install -g opencode-ai
opencode   # 验证安装

用 CC-Switch 完成配置

下载并安装 CC-Switch。
选择 OpenCode → 添加供应商。
按下表填字段，保存后重启终端：

字段	取值
预设供应商	自定义
供应商 ID	自定义，如 `gateway-codex`
接口格式	按模型选 Anthropic / OpenAI / Google
API Key	对应分组的令牌
额外选项	`{"setCacheKey":true}`
模型配置	填入与令牌分组匹配的模型 ID 与展示名

分组对照

GPT 系列：codex / gpt-officially。
Claude 系列：aws-q / aws / claude-officially。
Gemini 系列：gemini-slb。

验证：重启终端运行 opencode，输入 /models，确认DMGateway通道在列表中。

OpenClaw

OpenClaw 适合 Linux 服务器与 macOS 部署，可作为 Telegram 等社交平台的 AI 后端。

安装

curl -fsSL https://openclaw.ai/install.sh | bash

之后按 QuickStart 引导：跳过初始供应商 → 选 anthropic 适配器 → 模型选 opus-4.5 → 配置社交平台 → 启用 Hook → 安装 shell 补全。

接入DMGateway

使用网关侧提供的 OpenClaw 配置脚本，自动添加DMGateway供应商。
选择目标模型并填入对应分组的令牌：
- Claude：aws-q / aws / claude-officially。
- GPT：codex / gpt-officially。
- Gemini：gemini-slb。
执行 openclaw gateway restart 重启网关。
通过控制台命令获取 Dashboard URL；公网部署建议加 nginx 反代和 HTTPS。

Telegram Bot

在 BotFather 创建 Bot 后，把 Bot Token 填入 OpenClaw 控制台并完成配对码确认，即可在 Telegram 中直接对话。

DeepSeek 接入 Claude Code

DeepSeek V4 系列可以通过网关被 Claude Code 直接调用，实现「Claude Code 体验 + DeepSeek 模型」。

前置

已经按前文完成 Claude Code 安装。
到DMGateway创建 deepseek-officially 分组的令牌。

方式一 · CC-Switch（推荐）

CC-Switch 中点 Claude Code → 添加供应商。
按下方字段填写：

字段	取值
名称	自定义
官网	`https://gateway.di-matrix.ai`
API Key	`deepseek-officially` 令牌
请求地址	`https://gateway.di-matrix.ai`
API 格式	Anthropic Messages（原生）
主模型	`deepseek-v4-pro` 或 `deepseek-v4-pro[1m]`
推理模型	同主模型
Haiku 默认	`deepseek-v4-flash`
Sonnet / Opus 默认	`deepseek-v4-pro` 系列

方式二 · 直接编辑 settings.json

Windows 路径：%userprofile%\.claude\settings.json；macOS 路径：~/.claude/settings.json。

{
  "env": {
    "ANTHROPIC_BASE_URL": "https://gateway.di-matrix.ai",
    "ANTHROPIC_AUTH_TOKEN": "{{token}}",
    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "deepseek-v4-flash",
    "ANTHROPIC_MODEL": "deepseek-v4-pro",
    "ANTHROPIC_REASONING_MODEL": "deepseek-v4-pro",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "deepseek-v4-pro",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "deepseek-v4-pro"
  }
}

验证：重启终端 → claude → 左下角能看到 DeepSeek 模型，发送一条消息确认。

GPT 接入 Claude Code

把 codex 分组的 GPT 模型路由到 Claude Code，需要利用 CC-Switch 的本地路由能力。

不推荐用于生产 这种组合方式在缓存、模型映射、MCP / Skills 等方面有兼容风险，建议把 GPT 留在 Codex、Claude 留在 Claude Code。

前置条件

本地已经安装 Claude Code。
本地已经安装并运行 CC-Switch（一定要打开本地路由，仅设置供应商不够）。

步骤

到DMGateway创建 codex 分组的令牌，命名为 codex。
CC-Switch 中点 Claude Code → 添加供应商，预设选「自定义」，字段：
- 官网：https://gateway.di-matrix.ai
- API Key：codex 令牌密钥
- 请求地址：https://gateway.di-matrix.ai
- API 格式：OpenAI Responses API（需要本地路由）
- 主模型：例如 gpt-5.5
- Haiku 模型：例如 gpt-5.4-mini
- Sonnet / Opus 模型：按需选择 GPT 模型
进入 CC-Switch 设置 → Routing → 展开「本地路由」并打开「路由总开关」。
「Routing Enabled」中只勾选 Claude。
回到主界面确认本地路由已开启，且当前选中的是带 codex 的DMGateway供应商。
检查 ~/.claude/settings.json：ANTHROPIC_BASE_URL 应当指向本地路由地址。
终端 claude 启动后发条消息确认正常即可。

Claude Code FAQ

VSCode 中如何让 Claude Code 插件走DMGateway？

在 %userprofile%\.claude（Windows）或 ~/.claude（macOS）目录下编辑 config.json，加入下面字段，然后重启 VSCode：

{ "primaryApiKey": "Gateway" }

对应的 settings.json 中环境变量保持网关配置不变即可。

常用 Claude Code 命令有哪些？

claude 启动交互式 REPL。
claude "你的问题" 启动并附带初始输入。
claude -p 一次性输出模式。
claude -c 继续上一次会话。
claude update 更新到最新版。
claude --model sonnet 指定模型。
claude --verbose 打印详细日志。

提示「无法连接 Anthropic 服务」怎么办？

这是 Claude Code 在首次启动时尝试与官方服务做引导握手导致的。修复思路是把 onboarding 标记写入配置文件，跳过握手：

Windows（PowerShell）：

$config = "$env:USERPROFILE\.claude.json"
$json = if (Test-Path $config) { Get-Content $config -Raw | ConvertFrom-Json } else { @{} }
$json.hasCompletedOnboarding = $true
$json | ConvertTo-Json -Depth 10 | Set-Content $config -Encoding UTF8

macOS（需要 jq，未安装可 brew install jq）：

config="$HOME/.claude.json"
[ -f "$config" ] || echo '{}' > "$config"
tmp=$(mktemp)
jq '.hasCompletedOnboarding = true' "$config" > "$tmp" && mv "$tmp" "$config"

如何把上下文从 1M 切回 200K？

在 ~/.claude/settings.json 的 env 中加入下面三个变量后重启 Claude Code：

{
  "env": {
    "CLAUDE_CODE_DISABLE_1M_CONTEXT": "1",
    "CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": "1",
    "CLAUDE_CODE_DISABLE_TERMINAL_TITLE": "1"
  }
}

Codex FAQ

感觉 Codex「降智」了？

多数情况下不是模型本身退化，而是用法问题。建议：

任务拆分：把模糊的「写一个管理系统后台」拆成模块化、文件级的小任务。
主动控制：提交前先评估范围，能预测 Codex 会改哪些文件再让它动手。
避免过度压缩：单轮使用上下文超过 60% 通常代表初始拆分不到位，老手很少需要 /compact。

Windows 下推荐怎么搭配置？

路径：%userprofile%\.codex。
编辑 config.toml，按本页 CLI 配置章节填入网关字段。
新建 AGENTS.md 写入全局 system prompt。
区域设置（Win+R → intl.cpl）启用 UTF-8，避免控制台乱码。

常用命令

/model、/review、/resume、/undo、/diff、/mention、/status、/exit。

报错排障

连接异常：检查网络与代理；关闭 VPN 后重启 VSCode / 终端。
401：确认环境变量 OPENAI_API_KEY、OPENAI_BASE_URL 与 config.toml 一致。
403：通常是账户额度或风控；稍后重试或联系运营。
编码问题：在 Windows 区域设置中开启 UTF-8 支持。

Gemini FAQ

Gemini CLI 偶尔无法调用模型 / 粘贴图片？

Gemini CLI 当前存在多种使用问题，例如调用失败、图片粘贴异常。优先考虑以下替代：

使用 VSCode 第三方插件，如 Roo Code。
仍要使用 CLI 时，优先选 antigravity 等更稳定的分组（注意此类模型可能不内置联网能力）。
Roo Code 中请求格式建议选「OpenAI Response」。

怎么在 Cline 中使用 Gemini-3？

VSCode 版本 ≥ 1.80.0。
到DMGateway创建 Gemini 分组的令牌。
VSCode 安装 Cline 插件，配置：
- Provider：OpenAI-compatible
- Base URL：https://gateway.di-matrix.ai/v1
- API Key：你的DMGateway令牌
- Model：gemini-3-pro-preview

建议优先使用代码专项变体以提升体验。

通用 FAQ

可以直接使用 OpenAI SDK 吗？

可以。只要 SDK 支持自定义 baseURL，就能接入 OpenAI 兼容接口。

为什么相同模型有多个渠道？

DMGateway会把同一个模型映射到多个上游，以实现容灾、负载均衡和成本优化；分组负责暴露给令牌使用。

请求失败会扣费吗？

通常不会对未成功完成的请求结算；具体取决于管理员配置和上游返回情况。

客户端连接超时怎么排查？

多半是 Base URL 写错、本机代理 / 防火墙拦截、TLS 被检测，或上游渠道排队。先用 curl 直接请求 /v1/models 验证。

如何限制某个令牌只能用指定模型？

在创建令牌时勾选「模型限制」，或在分组层面配置允许列表，再配合额度限制降低误用风险。

计费说明

计费按「模型倍率 × 实际消耗 token × 渠道倍率」结算，最终费用以控制台账单为准。

倍率可按模型或渠道单独配置；分组层级再叠加一层折扣。
流式响应在请求结束时统一结算。
管理员可配置预扣费策略和失败返还策略，对长请求更友好。
图像生成按张计费，建议查看模型广场说明。

限额与风控

避免密钥滥用的常见手段：

请求频率限制（每秒 / 每分钟）。
来源 IP 白名单或区域限制。
模型白名单，限定令牌只能调用部分模型。
每日 / 每月额度预算，触发后冻结密钥。
异常调用告警，例如请求耗时、失败率突然升高时通知管理员。

日志与排障

消费日志是定位问题的第一入口。排查时重点查看请求时间、令牌名称、模型、渠道、状态码和错误信息。

现象	优先检查	下一步
401	令牌是否填错、前缀是否包含 Bearer	重新创建测试令牌验证
404 / 模型不存在	模型名、分组权限、渠道映射	到模型广场复制准确模型名
响应很慢	上游渠道状态、网络代理、流式设置	切换分组或优化线路
图像超时	客户端超时阈值、代理拦截	调高超时；将网关域名加入直连白名单

可接受使用

下面是面向所有用户的通用红线，正式上线前请基于自己的合规要求和适用法律进行调整。

禁止的用途

违法活动、儿童剥削相关内容。
破坏关键基础设施（电信、医疗、能源、交通、供水、金融、选举等）。
制作恶意软件、未授权访问他人系统。
武器、军事系统或自主武器相关研发。
煽动暴力、对受保护群体的仇恨言论。
侵犯隐私、骚扰、跟踪、身份盗用。
儿童性剥削（CSAM）或将未成年人性化的内容。
用于经济、政治、公共卫生等领域的有组织虚假信息。
预测性执法、量刑决策、大规模监控。
欺诈、冒名、剥削性金融行为。
滥用平台、绕过安全机制或速率限制。
未经合法目的的露骨色情内容。

高风险场景额外要求

下列场景必须满足：(1) 由专业人士审核最终决策；(2) 向用户披露 AI 参与生成。

法律建议或具有法律影响的决策。
医疗 / 健康相关诊断与建议。
保险承保与理赔决策。
金融决策与投资建议。
就业、住房资格审查。
升学考试与录取相关。
面向公众自动生成的新闻内容。

服务条款

正式合同建议涵盖以下条款，可根据公司主体与适用法律自行修改。

服务范围：授予客户使用 API 的非排他性权利；明确禁止逆向工程、转售或与服务直接竞争。
内容归属：客户保留输入所有权；输出归属由协议显式约定，常见做法是输出归属于客户、提供方不会使用客户内容训练模型。
数据隐私：以数据处理协议（DPA）为准，列明子处理方、数据保留与删除策略。
合规要求：客户须遵守 AUP、支持地区策略；产品向最终用户披露 AI 参与并提示输出可能不准确。
付款与退款：按照定价页费率结算，价格调整提前通知；逾期可暂停或终止服务。
终止条款：双方均可在合理期限内终止；重大违约保留补救期；保留条款（保密、责任）在终止后继续生效。
争议解决：先内部协商，再仲裁或司法诉讼，按所在司法辖区调整。
责任限额：排除间接、附带、后果性损失；总责任以前 12 个月费用为上限（除知识产权赔偿等例外）。
赔偿：提供方对授权使用过程中的知识产权侵权进行抗辩；客户对其输入或违规行为进行反向赔偿。

服务专属条款

除通用条款外，针对特定服务建议补充以下子条款。

团队 / 企业版：管理员需向最终用户披露所使用的服务及隐私政策。
Beta 服务：仅供非生产用途，提供方对 Beta 服务的总责任有上限（例如 1000 美元或近 12 个月费用之较小者）。
微调服务：客户可使用自有数据进行微调，明确该数据不视为违反训练限制。
云托管：通过 AWS Bedrock / Vertex AI 等云厂商运行，客户须同时遵守云厂商的政策。
API 限制：明确速率、配额、缓存、监控要求。
SLA 与数据保留：声明月度可用率（如 99.9%）、备份策略、合同终止后的数据删除。
开发者合作计划：客户可选择性同意将其数据用于产品改进或模型训练。

支持地区

对外商业 API 服务覆盖大量国家与地区，下面是常见示例，最终以你部署的支持地区清单为准：

欧洲

德国、法国、英国、西班牙、意大利、北欧国家、冰岛等。

亚太

日本、韩国、印度、新加坡、澳大利亚、新西兰等。

美洲

美国、加拿大、巴西、墨西哥、阿根廷等。

非洲

南非、埃及、肯尼亚、尼日利亚等。

中东

阿联酋、沙特阿拉伯、以色列、卡塔尔等。

未列出地区

请联系运营评估是否支持，部分地区可能存在额外限制。

运营建议

对外运营时建议补充服务条款、可接受使用政策、隐私政策和地区支持说明。团队内部部署也应明确密钥保管和日志留存规则。

可接受使用

定义禁止请求类型、滥用处理方式和账户停用条件。

隐私与日志

说明请求日志、错误日志、用户信息和账单数据的保留策略。

服务可用性

说明上游渠道故障、维护窗口、退款 / 补偿边界。