统一入口 · 多模型路由 · 透明计费

DMGateway使用说明

这份图文文档帮助你完成从注册、充值、创建令牌,到使用 CC-Switch、Claude Code、Codex CLI、Gemini CLI、Cursor、OpenAI SDK 以及绘图模型的全流程接入; 并提供桌面客户端进阶玩法、常见问题和服务条款建议,方便企业或个人快速上手 AI API 网关。

客户端请求经过DMGateway路由到多个模型供应商的示意图
统一入口负责认证、限流、计费和模型路由,业务代码只需要维护一套调用配置。

文档目录

建议第一次接入时从注册流程开始按顺序阅读;如果只想接入某一个客户端,可以直接跳到对应章节。

基础地址 https://gateway.di-matrix.ai 正式部署时请替换为你自己的DMGateway域名;本文以 gateway.di-matrix.ai 作为占位。

控制台总览

登录控制台之后,左侧会出现「钱包管理」「令牌管理」「模型广场」「账单/日志」等入口;右上角通常会显示余额和当前生效的分组。

DMGateway控制台概览示意图
原创示意图,仅展示功能区结构。实际界面以你的部署版本为准。
  • 钱包管理:充值、查看消费、申请发票。
  • 令牌管理:创建、停用、调整额度和分组。
  • 模型广场:按分组查看可用模型、倍率、上下文长度。
  • 账单 / 日志:定位单次请求的耗时、token 数和扣费。

快速开始

从注册到完成第一次调用一般只需要 5 分钟,整体流程是:

1

注册并登录

使用 Google 一键登录或邮箱注册,写入会话后跳转到控制台。

2

充值并获取额度

在「钱包管理」选择金额、是否需要发票,完成支付即时到账。

3

创建令牌

在「令牌管理」按用途选择分组,记下生成的 sk- 开头的密钥。

4

客户端接入

用 CC-Switch 一键配置,或把 Base URL、API Key 写入 CLI 的配置文件。

注册账户

访问DMGateway的注册地址(一般是 https://gateway.di-matrix.ai/register),可以选择 Google 一键授权或邮箱注册两种方式。

注册流程示意图:登录页 → 授权 / 校验 → 控制台
无论选择哪一种方式,目标都是写入会话 Cookie 之后跳转到控制台。

方式一 · Google 授权(推荐)

  1. 在登录页点击「使用 Google 继续」按钮。
  2. 在弹出的 Google 账户选择窗口中挑选一个账户并授权。
  3. 授权完成后系统自动创建账号并跳转到控制台,无需额外设置密码。

方式二 · 邮箱注册

  1. 点击登录页底部的「没有账号?立即注册」。
  2. 填写邮箱、用户名和密码,密码建议字母 + 数字 + 特殊字符。
  3. 按提示完成邮箱验证或验证码校验,提交后即可使用。
提示 邮箱既用于校验,也是接收账单和服务通知的渠道,建议使用个人长期可用的邮箱。

登录账号

登录入口与注册同址,输入完成后浏览器会保持会话,下次访问无需再次输入密码;切换设备需要重新登录。

常见登录方式

  • Google 登录:点击「使用 Google 继续」,选择已注册过的 Google 账号即可。
  • 邮箱 / 用户名 + 密码:依次输入账号和密码,点击「继续」。

登录失败的处理

若提示「OIDC token 获取失败」「会话过期」,多半是浏览器缓存或 Cookie 异常,按以下步骤清理后重试:

  • Windows / Linux Chrome:Ctrl + Shift + Delete 打开清理面板,勾选 Cookie 与缓存后清除。
  • macOS Chrome:Command + Shift + Delete 同样可打开清理面板。
  • 仍异常时,按 F12 打开开发者工具 → Application → Storage → Cookies → 选择当前域名 → 删除 session 与登录相关 Cookie,刷新后重新登录。

充值与开票

登录控制台后进入左侧「钱包管理」,按以下三步完成充值。

1

选择金额

选用预设档位(如 50 / 100 / 500 元)或自定义金额,最低限额以页面提示为准。

2

是否开票

不需要发票直接选「无需发票」;需要中国大陆增值税电子普通发票时勾选「大陆发票」并填写抬头与税号。

3

确认支付

核对底部「实际支付金额」后点击「立即支付」,按支付宝 / 微信支付提示完成扫码或跳转。

额度换算

常见的换算关系是 1 元人民币 = 1 美元额度,最终以页面显示为准。请求是否成功扣费、是否退款均可在「账单」中查看明细。

支付页打不开 若使用支付宝或微信支付时支付页一直加载不出,请先关闭 VPN / 系统代理或开启分流,让支付域名直连后再次尝试。

创建 API 令牌

令牌是访问DMGateway的凭证。建议按用途、环境或团队成员各创建一支,方便审计、停用和差异化额度。

创建令牌的表单与分组示意图
名称用于在日志中识别用途;分组直接决定能调用哪些模型。

创建步骤

  1. 登录控制台后进入「令牌管理」。
  2. 点击页面顶部「添加令牌」,会弹出新建表单。
  3. 填写名称(建议体现用途,例如 claude-codecodexgemini)。
  4. 选择令牌分组,决定可用模型与计费倍率(详见下文「令牌分组」)。
  5. 设置过期时间,默认「永不过期」即可。
  6. 数量保持 1,确认是否「不限额度」。
  7. 新手不建议开启模型限制和 IP 白名单,等接通后再按需收紧。
  8. 点击提交,把生成的 sk- 开头密钥复制到本地保存。
关键提醒 分组选错最常见的报错是「模型不存在」。请按目标客户端选择对应分组,例如 Claude Code 选 CC 分组、Codex 选 codex 分组、Gemini 选 gemini 分组。

密钥管理建议

  • 生产密钥不要写进前端代码或公开仓库。
  • 测试密钥设置较小额度和较短有效期。
  • 泄露后立即在控制台禁用旧密钥,并创建新密钥。
  • 团队成员尽量持有独立令牌,便于通过日志追溯调用来源。

环境检查

开始配置前先确认网络、客户端和密钥状态,能解决大部分「连接失败」「模型不可用」类问题。

网络连通

本机可访问DMGateway域名,公司或代理软件没有拦截 HTTPS 流量;图像生成等长请求建议加入直连白名单。

客户端版本

IDE / CLI / SDK 版本支持自定义 Base URL 和 Bearer Token;Cline、Roo Code 等需 VSCode ≥ 1.80。

账户与令牌

账户余额充足,令牌未过期;目标模型在令牌分组的可用范围内。

Node.js 验证

大多数 CLI 工具依赖 Node.js 与 npm。任意终端中执行:

npm list -g --depth-0

没有报错即说明 Node.js 与 npm 可用,列表为空也没关系。如果提示 command not found,先安装 Node.js(建议 LTS 版本)后再继续。

CLI 选择

DMGateway对外提供两个常用 API 入口:

主入口

https://gateway.di-matrix.ai,对应稳定生产环境。OpenAI 兼容客户端在末尾追加 /v1

优化线路

https://gateway.di-matrix.ai,针对延迟敏感场景启用更激进的负载均衡。

选择策略

普通使用建议主入口;遇到长尾延迟、丢包或部分模型不稳定时切到优化线路。

具体客户端有两条接入路径:

  • CC-Switch 桌面端 / CLI(推荐):图形界面或终端命令,一键管理 Claude Code、Codex、Gemini 配置,不用手写 JSON / TOML。
  • CLI 手动配置:直接编辑 ~/.claude/settings.json~/.codex/config.toml~/.gemini/.env 等文件,适合对配置有完全掌控需求的开发者。

模型广场

控制台右上角的「模型广场」展示可用模型、所属分组、计费倍率和上下文长度。第一次使用建议先在这里挑选模型并复制准确的模型名。

模型 所属分组 建议场景
gpt-4o-mini Default / Codex 客服、摘要、轻量代理
claude-sonnet-4 CC / Claude 代码、长文档、规划
claude-opus-4.5 claude-officially 超长上下文、深度推理
gemini-2.5-pro Gemini / gemini-slb 多模态、知识检索
gpt-image-2 sora 文生图、图像编辑
避免抄错模型名 模型名区分大小写和后缀(例如 [1m] 表示 1M 上下文),尽量从模型广场点击复制按钮拷贝。

令牌分组

分组让令牌只能调用一组模型,并对应一个计费倍率。新建令牌时选错分组就会出现「模型不存在」「权限不足」。

倍率含义

  • 低于 1 倍:折扣,例如 ×0.5 等同于 5 折,×0.8 等同于 8 折。
  • 等于 1 倍:原价。
  • 高于 1 倍:加价,例如 ×1.5 表示在原价基础上加收 50%。

常见分组

分组 覆盖模型 典型用途
Default 通用聊天模型 未指定分组时的兜底
CC Claude 系列(Anthropic 协议) Claude Code、Claude Desktop
Codex GPT 代码 / 通用模型 Codex CLI、IDE 代码助手
Gemini / gemini-slb Gemini 系列 Gemini CLI、Roo Code
aws / aws-q AWS Bedrock 上的 Claude 对接 AWS 通道时优先选用
azure Azure OpenAI 需要走 Azure 通道时
claude-officially / claude-sale Anthropic 官方通道 对延迟和稳定性要求高时
doubao / pplx / deepseek-officially 豆包、Perplexity、DeepSeek 等 多模型对比、特定厂商专项
sora 图像 / 视频生成 GPT-Image、Banana 等绘图模型

具体可用分组以控制台「模型广场 → 可用分组」显示为准;管理员可定制更多分组并配置倍率。

CC-Switch · 通用步骤

CC-Switch 是一个跨平台桌面工具,用 GUI 集中管理 Claude Code、Codex、Gemini 的供应商、模型和 MCP 服务,省去手写配置文件。

CC-Switch 桌面端的分组、供应商、激活三栏布局
左侧选择分组 → 中间填写供应商 → 右侧激活,是几乎所有客户端的统一流程。

安装

所有版本均可在 GitHub Releases 页面找到。

核心能力

  • 不同供应商之间快速切换。
  • 预置DMGateway模板,避免漏填字段。
  • 统一管理 MCP(Model Context Protocol)服务、系统提示词、Skills 扩展。
  • 系统托盘快捷入口。
  • 当前主线版本基于 Tauri 2,支持 Windows / macOS / Linux。

Claude Code 配置(CC-Switch)

  1. 启动 CC-Switch,进入主界面。
  2. 在分组栏选择 Claude
  3. 供应商下拉选择「自定义」,填写以下字段:
    • 请求地址:https://docgateway.di-matrix.ai注意:请求地址与控制台登录地址不同
    • API 格式:Anthropic 原生
  4. 到DMGateway控制台「令牌管理」按 CC 分组创建令牌,复制密钥。
  5. 把密钥粘贴到 API Key 字段,点击「添加」。
  6. 在主界面对应供应商点「启用」,状态变为「使用中」即生效。
  7. 在「设置」中勾选「跳过 Claude Code 初次确认」。
  8. 终端执行 claude,能正常进入对话即代表配置完成。
注意 CC 分组在 CC-Switch 中可能不支持「调用测试」。请直接在 Claude Code 中实际发送一条消息验证。

Codex 配置(CC-Switch)

  1. 启动 CC-Switch,分组栏切换到 Codex
  2. 供应商下拉选择「自定义」,填写以下字段:
    • 请求地址:https://docgateway.di-matrix.ai
    • API 格式:OpenAI Responses API
  3. 到DMGateway控制台创建 codex 分组的令牌并复制密钥。
  4. 粘贴 API Key,点右下角「添加」。
  5. 回到主界面,点击右侧「启用」,状态显示「使用中」。
  6. 终端执行 codex,进入聊天界面即说明配置成功。

Gemini 配置(CC-Switch)

  1. 启动 CC-Switch,分组栏切到 Gemini
  2. 供应商选择「自定义」,填写以下字段:
    • 请求地址:https://docgateway.di-matrix.ai
    • API 格式:Google Gemini
  3. 控制台创建 Geminigemini-slb 分组的令牌。
  4. 把 API Key 粘贴到表单,点「添加」。
  5. 主界面「启用」对应分组,状态为「使用中」。
  6. 终端执行 gemini,能进入对话即说明完成。

CC-Switch CLI

CC-Switch CLI 是 CC-Switch 的命令行版本,适合服务器、远程开发场景,能管理供应商、MCP、Skills、提示词。

安装

# macOS(universal)
curl -LO https://github.com/saladday/cc-switch-cli/releases/latest/download/cc-switch-cli-darwin-universal.tar.gz
tar -xzf cc-switch-cli-darwin-universal.tar.gz
chmod +x cc-switch
sudo mv cc-switch /usr/local/bin/

# Linux x64-musl
curl -LO https://github.com/saladday/cc-switch-cli/releases/latest/download/cc-switch-cli-linux-x64-musl.tar.gz
tar -xzf cc-switch-cli-linux-x64-musl.tar.gz
chmod +x cc-switch
sudo mv cc-switch /usr/local/bin/

# Windows:下载对应 zip,把 cc-switch.exe 加入 PATH

常用命令

cc-switch provider list           # 查看供应商
cc-switch provider switch <id>    # 切换供应商
cc-switch mcp sync                # 同步 MCP 服务器
cc-switch mcp add                 # 新增 MCP
cc-switch prompts list            # 查看提示词
cc-switch prompts activate <id>   # 激活提示词
cc-switch skills install <name>   # 安装 Skill
cc-switch skills sync             # 同步 Skill
cc-switch config backup           # 备份配置
cc-switch config restore          # 恢复配置

添加DMGateway供应商

  1. 执行 cc-switch 进入 TUI。
  2. 选择 Providers,按 a 新增。
  3. 选择「自定义」。
  4. 填写 API Key 字段。
  5. Ctrl+S 保存,确认列表中已选中新供应商后退出。

CLI 手动配置 · 环境与安装

不想用 CC-Switch 的同学可以直接安装并配置三大 CLI,整体只有三步:验证 Node.js、安装命令行、首次启动生成配置目录。

1. 确认 Node.js

npm list -g --depth-0

若提示找不到命令请先安装 Node.js(建议 LTS)后再继续。

2. 安装三个 CLI

工具安装命令系统要求
Claude Code npm i -g @anthropic-ai/claude-code@latest Node.js ≥ 18,macOS / Linux / Windows(WSL)
Codex CLI npm i -g @openai/codex@latest Node.js ≥ 22
Gemini CLI npm i -g @google/gemini-cli@latest Node.js ≥ 18
npm i -g @anthropic-ai/claude-code@latest
npm i -g @openai/codex@latest
npm i -g @google/gemini-cli@latest
Windows 用户 Claude Code 在 Windows 上需要通过 WSL(Windows Subsystem for Linux)运行。Codex CLI 和 Gemini CLI 支持原生 Windows PowerShell / CMD。

3. 首次启动生成配置目录

claude   # 第一次启动 Claude Code
codex    # 第一次启动 Codex CLI
gemini   # 第一次启动 Gemini CLI

每个工具首次运行都会在用户目录下创建配置文件夹(~/.claude~/.codex~/.gemini),后续手动配置都基于这些目录。

三大 CLI 的配置文件结构示意图
不同 CLI 各自有独立目录与配置格式:JSON、TOML、.env。

Claude Code · 手动配置

Windows

  1. Win+R 输入 %userprofile%\.claude 打开配置目录。
  2. 新建或打开 settings.json,写入下方模板。
  3. xxx 替换为 CC 分组的 API Key。
  4. 终端执行 claude 验证。

macOS

  1. 在 Finder 按 Command+Shift+G,输入 ~/.claude 打开目录。
  2. 新建或编辑 settings.json,使用同样的内容。
  3. 替换密钥并执行 claude
~/.claude/settings.json
{
  "env": {
    "ANTHROPIC_BASE_URL": "https://gateway.di-matrix.ai",
    "ANTHROPIC_AUTH_TOKEN": "xxx",
    "CLAUDE_CODE_ATTRIBUTION_HEADER": "0",
    "CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": "1",
    "CLAUDE_CODE_DISABLE_TERMINAL_TITLE": "1"
  }
}
  • ANTHROPIC_BASE_URL:DMGateway根地址。
  • ANTHROPIC_AUTH_TOKEN:CC 分组的 API Key。
  • 其它三个开关用于减少与官方服务的非必要握手与流量,避免「无法连接 Anthropic 服务」类提示。

如果首次运行仍提示需要登录,请到 Claude Code FAQ 中按系统执行一次 onboarding 标记修复。

Codex CLI · 手动配置

Windows

  1. Win+R 输入 %userprofile%\.codex 打开配置目录。
  2. 确保存在三个文件,缺则新建:config.toml(核心配置)、auth.json(密钥)、AGENTS.md(全局系统提示)。
  3. 把下方 config.toml 模板写入 config.toml
  4. 把密钥写入 auth.json
  5. 终端执行 codex 验证。

macOS

  1. 在 Finder 按 Command+Shift+G,输入 ~/.codex
  2. 同样的三个文件结构,按 macOS 模板写入 config.toml
  3. 替换密钥后执行 codex
~/.codex/config.toml(Windows)
disable_response_storage = true
model = "gpt-5.2"
model_provider = "gateway"
model_reasoning_effort = "xhigh"
model_verbosity = "high"

[features]
web_search_request = true

[model_providers.gateway]
base_url = "https://gateway.di-matrix.ai/v1"
name = "gateway"
requires_openai_auth = true
wire_api = "responses"
~/.codex/config.toml(macOS)
model_provider = "gateway"
model = "gpt-5.1-codex"
model_reasoning_effort = "high"
network_access = "enabled"
disable_response_storage = true
windows_wsl_setup_acknowledged = true
model_verbosity = "high"

[model_providers.gateway]
name = "gateway"
base_url = "https://gateway.di-matrix.ai/v1"
wire_api = "responses"
requires_openai_auth = true
~/.codex/auth.json
{
  "OPENAI_API_KEY": "sk-your-api-key"
}

AGENTS.md 用于设定 Codex 在所有项目中共享的系统提示,例如「使用中文回答」「不要修改超过 2 个文件」「输出统一带 token 计数」等。

Gemini CLI · 手动配置

Windows

  1. Win+R 输入 %userprofile%\.gemini
  2. 新建或编辑 .env 文件,加入下方变量。
  3. 替换 xxxGemini 分组的 API Key。
  4. 终端执行 gemini 验证。

macOS

  1. Finder 按 Command+Shift+G,输入 ~/.gemini
  2. 编辑同样的 .env 文件并保存。
  3. 替换密钥后执行 gemini
~/.gemini/.env
GOOGLE_GEMINI_BASE_URL=https://gateway.di-matrix.ai
GEMINI_API_KEY=sk-your-api-key
GEMINI_MODEL=gemini-2.5-pro

如使用 gemini-3-pro-preview 等新模型,可以把 GEMINI_MODEL 改为对应名称;命令启动时会自动应用。

Cursor

在 Cursor 设置 → Models → OpenAI Compatible Provider,启用并填写DMGateway地址和密钥。

Base URL: https://gateway.di-matrix.ai/v1
API Key:  sk-your-api-key
Model:    gpt-4o-mini

如需使用 Claude 系列模型,可在 Cursor 模型列表里手动添加 claude-sonnet-4claude-opus-4.5 等模型名;Cursor 仍按 OpenAI 兼容协议向DMGateway发起请求,由DMGateway完成协议转换。

VSCode 插件

VSCode 生态中有多款 AI 编程插件支持自定义 OpenAI 兼容接口,只需填入网关地址和令牌即可接入。

Claude Code 插件(官方)

Anthropic 官方提供的 VSCode 插件,将 Claude Code 的能力直接嵌入编辑器侧边栏,无需切换终端。

  1. VSCode 扩展市场搜索 Claude Code(发布者 Anthropic)并安装。
  2. 插件复用 ~/.claude/settings.json 中的网关配置,无需单独填写地址。若尚未配置,请先按「CLI 手动配置 → Claude Code」章节完成设置。
  3. 安装后重启 VSCode,侧边栏出现 Claude 图标即代表生效。
  4. 若插件仍提示登录,在 ~/.claude 目录下编辑 config.json,加入以下字段后重启 VSCode:
    { "primaryApiKey": "Gateway" }

Cline

Cline 是功能完整的 AI 编程助手,支持文件读写、终端执行、浏览器操作等 Agent 能力。

  1. VSCode 扩展市场搜索 Cline 并安装。
  2. 打开 Cline 侧边栏 → 点击右上角设置图标。
  3. API Provider 选择 OpenAI Compatible,填写:
    Base URL: https://gateway.di-matrix.ai/v1
    API Key:  sk-your-api-key
    Model:    claude-sonnet-4
  4. 点击「Save」,在对话框发送一条消息验证。

Roo Code

Roo Code 是 Cline 的社区分支,界面和配置方式基本相同,额外支持更多模型格式选项。

  1. VSCode 扩展市场搜索 Roo Code 并安装。
  2. 打开 Roo Code 侧边栏 → 设置。
  3. Provider 选 OpenAI Compatible,请求格式建议选 OpenAI Response,填写:
    Base URL: https://gateway.di-matrix.ai/v1
    API Key:  sk-your-api-key
    Model:    claude-sonnet-4

Continue

Continue 支持代码补全与对话两种模式,配置文件为 ~/.continue/config.json

  1. VSCode 扩展市场搜索 Continue 并安装。
  2. 打开 Continue 侧边栏 → 点击右下角配置图标,编辑 config.json,在 models 数组中添加:
{
  "title": "DMGateway",
  "provider": "openai",
  "model": "claude-sonnet-4",
  "apiKey": "sk-your-api-key",
  "apiBase": "https://gateway.di-matrix.ai/v1"
}
  1. 保存后 Continue 自动重载,在模型下拉中选择 DMGateway 即可使用。
令牌分组 调用 Claude 系列模型时使用 CC 分组令牌;调用 GPT 系列时使用 codex 分组令牌;调用 Gemini 系列时使用 Gemini 分组令牌。

OpenAI SDK

所有兼容 OpenAI Chat Completions 的客户端都可以用同一方式接入。

Node.js
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.NEW_API_KEY,
  baseURL: "https://gateway.di-matrix.ai/v1",
});

const response = await client.chat.completions.create({
  model: "gpt-4o-mini",
  messages: [{ role: "user", content: "用一句话介绍DMGateway" }],
});

console.log(response.choices[0].message.content);
Python
from openai import OpenAI

client = OpenAI(
    api_key="sk-your-api-key",
    base_url="https://gateway.di-matrix.ai/v1",
)

resp = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": "用一句话介绍DMGateway"}],
)
print(resp.choices[0].message.content)

兼容 One API

已有 One API / OpenAI 兼容代码时,通常只需把 baseURL 与密钥换成DMGateway对应字段即可,其他业务代码保持不变。

curl https://gateway.di-matrix.ai/v1/models \
  -H "Authorization: Bearer sk-your-api-key"

响应中会列出令牌分组下的所有可用模型;常用于自动同步前端模型下拉。

聊天补全

推荐使用 /v1/chat/completions。请求体遵循 OpenAI 兼容格式,并支持流式输出。

curl https://gateway.di-matrix.ai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer sk-your-api-key" \
  -d '{
    "model": "gpt-4o-mini",
    "messages": [
      { "role": "user", "content": "写一个 HTTP 重试策略" }
    ]
  }'

对于 Anthropic 原生协议的 Claude 调用,可使用 /v1/messages;Codex CLI 默认使用 /v1/responses,由网关在内部转换。

图像与文件

多模态模型可接收图片 URL 或上传文件。请确认目标渠道支持对应输入:

  • image_url:通过 URL 引用,要求模型可访问该地址。
  • image_base64:直接把图片 base64 写入 content
  • file_id:先调用 /v1/files 上传文件再引用 ID(部分模型可用)。

文生图与图像编辑请参考 绘图模型 章节。

流式响应

设置 stream: true 可启用 SSE 流式返回,适合聊天、IDE 和长文本生成场景。

{
  "model": "gpt-4o-mini",
  "stream": true,
  "messages": [{ "role": "user", "content": "逐步解释 Redis 限流" }]
}

返回数据是按 data: 行的 SSE 流,最后以 data: [DONE] 结束。客户端建议保留心跳超时(30s)并在断流时重试。

错误码

状态码 含义 处理建议
400 请求参数错误 检查模型名、参数类型,尤其 messages 结构
401 密钥无效或缺失 检查 Authorization Header、Bearer 前缀
403 账户 / 分组无权访问该模型 更换分组或确认计费状态后重试
404 模型不存在或路径写错 到模型广场复制准确名称,确认 Base URL 是否带 /v1
429 频率或额度受限 降低并发或提升配额;图像类请求增加重试间隔
500 / 502 / 503 上游渠道异常 稍后重试或切换至其它分组 / 优化线路

Banana 系列绘图

Banana 2 Pro 是网关侧封装好的图像生成模型,常通过 Cherry Studio 等桌面客户端使用。

图像生成请求经过 /v1/images/* 接口路由到上游绘图模型
图像类请求建议加大超时阈值,并把网关域名加入直连白名单,避免代理截断。

前置准备

  1. 到控制台「令牌管理」创建 Gemini 分组的令牌(Banana 系列在该分组中)。
  2. 下载 Cherry Studio 官方版本并安装。

Cherry Studio 接入

  1. 打开设置 → 模型服务 → 添加。
  2. 提供商名称:gateway-banana;类型选择适合图像生成的选项。
  3. API Key:填入 Gemini 分组的令牌密钥。
  4. API 地址:https://gateway.di-matrix.ai
  5. 在模型管理中选择已预置的「常见比例 / 分辨率」绘图模型。
  6. 关闭模型设置中的「流式输出」(重要),否则可能无法返回图像。
  7. 从模型下拉中选中绘图模型,输入提示词即可开始生成。

GPT-Image 系列绘图

gpt-image-2 属于 sora 分组,使用前请创建该分组令牌。推荐通过 OpenAI 兼容的 Images API 调用。

调用接口

  • 文生图:POST https://gateway.di-matrix.ai/v1/images/generations
  • 图像编辑 / 变体:POST https://gateway.di-matrix.ai/v1/images/edits

示例请求

curl --location 'https://gateway.di-matrix.ai/v1/images/generations' \
  --header 'Authorization: Bearer sk-your-sora-key' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "gpt-image-2",
    "prompt": "橘猫披着围巾抱着水獭,温暖插画风",
    "size": "3840x2160",
    "quality": "high",
    "n": 1
  }'

关键参数

参数 取值 说明
model gpt-image-2 固定值
prompt 字符串 建议描述主体、场景、风格、画幅比例
n 1 当前仅支持单张
size 1024×1024 / 1536×1024 / 3840×2160 等 宽高均需为 16 的倍数;总像素 655 360 ~ 8 294 400;最长边 ≤ 3840;最大宽高比 3:1
quality low / medium / high / auto 质量越高耗时越长
response_format url(推荐)/ b64_json URL 形式更易调试
output_format png / jpeg 需要透明通道用 png

不支持的方式

  • Responses API 不支持图像生成参数。
  • Chat Completions 接口的 image 字段不会被解析为绘图设置,只能用 Images API。
易超时 图像生成单次请求可能持续 30~90 秒,请适当调高客户端超时;将 gateway.di-matrix.ai 加入代理白名单,避免被截断。

Claude Desktop

Claude Desktop 提供桌面级聊天界面,可以通过开发者模式接入第三方推理后端。

桌面客户端通过统一 Base URL 与 API Key 接入网关示意图
桌面端的核心字段是 Base URL、API Key、API Format 三项,模型名从模型广场复制即可。

下载安装

  • 到 Claude 官网下载页选择对应系统的安装包。
  • Windows:在安装包目录打开命令提示符,先设置代理(示例端口 7897)再启动安装:
    set HTTP_PROXY=http://127.0.0.1:7897
    set HTTPS_PROXY=http://127.0.0.1:7897
    "Claude Setup.exe"
  • macOS:双击 dmg 直接安装,无需代理。

开启开发者模式

  • Windows:点击邮箱输入框,按 Tab 进入菜单,Help → Troubleshooting → Enable developer mode
  • macOS:直接通过菜单栏 Help → Troubleshooting → Enable developer mode

填写第三方推理端点

  1. 打开菜单 Developer → Configure third-party inference
  2. Gateway base URL:https://gateway.di-matrix.ai
  3. Gateway API key:CC 分组的令牌密钥。
  4. 勾选「Skip login-mode chooser」。
  5. 点击「Apply locally」保存。

AionUI

AionUI 是统一的 GUI 客户端,可同时管理 Claude Code、Codex、Gemini CLI 三类后端,适合不熟悉终端的用户。

安装

  • Windows:到 GitHub Releases 下载 .exe 安装。
  • macOS:brew install aionui,或下载 .dmg / .zip(兼容 Intel 与 Apple Silicon)。
  • Linux:
    wget https://github.com/iOfficeAI/AionUi/releases/latest/download/AionUi-x.x.x-linux-amd64.deb
    sudo dpkg -i AionUi-x.x.x-linux-amd64.deb

分别配置三类模型

  1. 到DMGateway创建对应分组的令牌:Gemini → Gemini,Claude → CC,Codex → codex
  2. 打开 AionUI → 设置 → LLM Configuration → Add Model。
  3. 平台选「Custom」,填写 API Key、Endpoint 和模型。
模型Endpoint分组
Geminihttps://gateway.di-matrix.aiGemini
Claudehttps://gateway.di-matrix.aiCC
Codexhttps://gateway.di-matrix.ai/v1codex

OpenCode

OpenCode 是开源的 AI 编程助手,支持终端、IDE 与桌面端协同。

安装

npm install -g opencode-ai
opencode   # 验证安装

用 CC-Switch 完成配置

  1. 下载并安装 CC-Switch。
  2. 选择 OpenCode → 添加供应商。
  3. 按下表填字段,保存后重启终端:
字段取值
预设供应商自定义
供应商 ID自定义,如 gateway-codex
接口格式按模型选 Anthropic / OpenAI / Google
API Key对应分组的令牌
额外选项{"setCacheKey":true}
模型配置填入与令牌分组匹配的模型 ID 与展示名

分组对照

  • GPT 系列:codex / gpt-officially
  • Claude 系列:aws-q / aws / claude-officially
  • Gemini 系列:gemini-slb

验证:重启终端运行 opencode,输入 /models,确认DMGateway通道在列表中。

OpenClaw

OpenClaw 适合 Linux 服务器与 macOS 部署,可作为 Telegram 等社交平台的 AI 后端。

安装

curl -fsSL https://openclaw.ai/install.sh | bash

之后按 QuickStart 引导:跳过初始供应商 → 选 anthropic 适配器 → 模型选 opus-4.5 → 配置社交平台 → 启用 Hook → 安装 shell 补全。

接入DMGateway

  1. 使用网关侧提供的 OpenClaw 配置脚本,自动添加DMGateway供应商。
  2. 选择目标模型并填入对应分组的令牌:
    • Claude:aws-q / aws / claude-officially
    • GPT:codex / gpt-officially
    • Gemini:gemini-slb
  3. 执行 openclaw gateway restart 重启网关。
  4. 通过控制台命令获取 Dashboard URL;公网部署建议加 nginx 反代和 HTTPS。

Telegram Bot

在 BotFather 创建 Bot 后,把 Bot Token 填入 OpenClaw 控制台并完成配对码确认,即可在 Telegram 中直接对话。

DeepSeek 接入 Claude Code

DeepSeek V4 系列可以通过网关被 Claude Code 直接调用,实现「Claude Code 体验 + DeepSeek 模型」。

前置

  1. 已经按前文完成 Claude Code 安装。
  2. 到DMGateway创建 deepseek-officially 分组的令牌。

方式一 · CC-Switch(推荐)

  1. CC-Switch 中点 Claude Code → 添加供应商。
  2. 按下方字段填写:
字段取值
名称自定义
官网https://gateway.di-matrix.ai
API Keydeepseek-officially 令牌
请求地址https://gateway.di-matrix.ai
API 格式Anthropic Messages(原生)
主模型deepseek-v4-prodeepseek-v4-pro[1m]
推理模型同主模型
Haiku 默认deepseek-v4-flash
Sonnet / Opus 默认deepseek-v4-pro 系列

方式二 · 直接编辑 settings.json

Windows 路径:%userprofile%\.claude\settings.json;macOS 路径:~/.claude/settings.json

{
  "env": {
    "ANTHROPIC_BASE_URL": "https://gateway.di-matrix.ai",
    "ANTHROPIC_AUTH_TOKEN": "{{token}}",
    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "deepseek-v4-flash",
    "ANTHROPIC_MODEL": "deepseek-v4-pro",
    "ANTHROPIC_REASONING_MODEL": "deepseek-v4-pro",
    "ANTHROPIC_DEFAULT_SONNET_MODEL": "deepseek-v4-pro",
    "ANTHROPIC_DEFAULT_OPUS_MODEL": "deepseek-v4-pro"
  }
}

验证:重启终端 → claude → 左下角能看到 DeepSeek 模型,发送一条消息确认。

GPT 接入 Claude Code

codex 分组的 GPT 模型路由到 Claude Code,需要利用 CC-Switch 的本地路由能力。

不推荐用于生产 这种组合方式在缓存、模型映射、MCP / Skills 等方面有兼容风险,建议把 GPT 留在 Codex、Claude 留在 Claude Code。

前置条件

  • 本地已经安装 Claude Code。
  • 本地已经安装并运行 CC-Switch(一定要打开本地路由,仅设置供应商不够)。

步骤

  1. 到DMGateway创建 codex 分组的令牌,命名为 codex
  2. CC-Switch 中点 Claude Code → 添加供应商,预设选「自定义」,字段:
    • 官网:https://gateway.di-matrix.ai
    • API Key:codex 令牌密钥
    • 请求地址:https://gateway.di-matrix.ai
    • API 格式:OpenAI Responses API(需要本地路由)
    • 主模型:例如 gpt-5.5
    • Haiku 模型:例如 gpt-5.4-mini
    • Sonnet / Opus 模型:按需选择 GPT 模型
  3. 进入 CC-Switch 设置 → Routing → 展开「本地路由」并打开「路由总开关」。
  4. 「Routing Enabled」中只勾选 Claude。
  5. 回到主界面确认本地路由已开启,且当前选中的是带 codex 的DMGateway供应商。
  6. 检查 ~/.claude/settings.jsonANTHROPIC_BASE_URL 应当指向本地路由地址。
  7. 终端 claude 启动后发条消息确认正常即可。

Claude Code FAQ

VSCode 中如何让 Claude Code 插件走DMGateway?

%userprofile%\.claude(Windows)或 ~/.claude(macOS)目录下编辑 config.json,加入下面字段,然后重启 VSCode:

{ "primaryApiKey": "Gateway" }

对应的 settings.json 中环境变量保持网关配置不变即可。

常用 Claude Code 命令有哪些?
  • claude 启动交互式 REPL。
  • claude "你的问题" 启动并附带初始输入。
  • claude -p 一次性输出模式。
  • claude -c 继续上一次会话。
  • claude update 更新到最新版。
  • claude --model sonnet 指定模型。
  • claude --verbose 打印详细日志。
提示「无法连接 Anthropic 服务」怎么办?

这是 Claude Code 在首次启动时尝试与官方服务做引导握手导致的。修复思路是把 onboarding 标记写入配置文件,跳过握手:

  • Windows(PowerShell):
$config = "$env:USERPROFILE\.claude.json"
$json = if (Test-Path $config) { Get-Content $config -Raw | ConvertFrom-Json } else { @{} }
$json.hasCompletedOnboarding = $true
$json | ConvertTo-Json -Depth 10 | Set-Content $config -Encoding UTF8
  • macOS(需要 jq,未安装可 brew install jq):
config="$HOME/.claude.json"
[ -f "$config" ] || echo '{}' > "$config"
tmp=$(mktemp)
jq '.hasCompletedOnboarding = true' "$config" > "$tmp" && mv "$tmp" "$config"
如何把上下文从 1M 切回 200K?

~/.claude/settings.jsonenv 中加入下面三个变量后重启 Claude Code:

{
  "env": {
    "CLAUDE_CODE_DISABLE_1M_CONTEXT": "1",
    "CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": "1",
    "CLAUDE_CODE_DISABLE_TERMINAL_TITLE": "1"
  }
}

Codex FAQ

感觉 Codex「降智」了?

多数情况下不是模型本身退化,而是用法问题。建议:

  • 任务拆分:把模糊的「写一个管理系统后台」拆成模块化、文件级的小任务。
  • 主动控制:提交前先评估范围,能预测 Codex 会改哪些文件再让它动手。
  • 避免过度压缩:单轮使用上下文超过 60% 通常代表初始拆分不到位,老手很少需要 /compact
Windows 下推荐怎么搭配置?
  1. 路径:%userprofile%\.codex
  2. 编辑 config.toml,按本页 CLI 配置章节填入网关字段。
  3. 新建 AGENTS.md 写入全局 system prompt。
  4. 区域设置(Win+R → intl.cpl)启用 UTF-8,避免控制台乱码。
常用命令

/model/review/resume/undo/diff/mention/status/exit

报错排障
  • 连接异常:检查网络与代理;关闭 VPN 后重启 VSCode / 终端。
  • 401:确认环境变量 OPENAI_API_KEYOPENAI_BASE_URLconfig.toml 一致。
  • 403:通常是账户额度或风控;稍后重试或联系运营。
  • 编码问题:在 Windows 区域设置中开启 UTF-8 支持。

Gemini FAQ

Gemini CLI 偶尔无法调用模型 / 粘贴图片?

Gemini CLI 当前存在多种使用问题,例如调用失败、图片粘贴异常。优先考虑以下替代:

  • 使用 VSCode 第三方插件,如 Roo Code。
  • 仍要使用 CLI 时,优先选 antigravity 等更稳定的分组(注意此类模型可能不内置联网能力)。
  • Roo Code 中请求格式建议选「OpenAI Response」。
怎么在 Cline 中使用 Gemini-3?
  1. VSCode 版本 ≥ 1.80.0。
  2. 到DMGateway创建 Gemini 分组的令牌。
  3. VSCode 安装 Cline 插件,配置:
    • Provider:OpenAI-compatible
    • Base URL:https://gateway.di-matrix.ai/v1
    • API Key:你的DMGateway令牌
    • Model:gemini-3-pro-preview

建议优先使用代码专项变体以提升体验。

通用 FAQ

可以直接使用 OpenAI SDK 吗?

可以。只要 SDK 支持自定义 baseURL,就能接入 OpenAI 兼容接口。

为什么相同模型有多个渠道?

DMGateway会把同一个模型映射到多个上游,以实现容灾、负载均衡和成本优化;分组负责暴露给令牌使用。

请求失败会扣费吗?

通常不会对未成功完成的请求结算;具体取决于管理员配置和上游返回情况。

客户端连接超时怎么排查?

多半是 Base URL 写错、本机代理 / 防火墙拦截、TLS 被检测,或上游渠道排队。先用 curl 直接请求 /v1/models 验证。

如何限制某个令牌只能用指定模型?

在创建令牌时勾选「模型限制」,或在分组层面配置允许列表,再配合额度限制降低误用风险。

计费说明

计费按「模型倍率 × 实际消耗 token × 渠道倍率」结算,最终费用以控制台账单为准。

  • 倍率可按模型或渠道单独配置;分组层级再叠加一层折扣。
  • 流式响应在请求结束时统一结算。
  • 管理员可配置预扣费策略和失败返还策略,对长请求更友好。
  • 图像生成按张计费,建议查看模型广场说明。

限额与风控

避免密钥滥用的常见手段:

  • 请求频率限制(每秒 / 每分钟)。
  • 来源 IP 白名单或区域限制。
  • 模型白名单,限定令牌只能调用部分模型。
  • 每日 / 每月额度预算,触发后冻结密钥。
  • 异常调用告警,例如请求耗时、失败率突然升高时通知管理员。

日志与排障

消费日志是定位问题的第一入口。排查时重点查看请求时间、令牌名称、模型、渠道、状态码和错误信息。

现象 优先检查 下一步
401 令牌是否填错、前缀是否包含 Bearer 重新创建测试令牌验证
404 / 模型不存在 模型名、分组权限、渠道映射 到模型广场复制准确模型名
响应很慢 上游渠道状态、网络代理、流式设置 切换分组或优化线路
图像超时 客户端超时阈值、代理拦截 调高超时;将网关域名加入直连白名单

可接受使用

下面是面向所有用户的通用红线,正式上线前请基于自己的合规要求和适用法律进行调整。

禁止的用途

  • 违法活动、儿童剥削相关内容。
  • 破坏关键基础设施(电信、医疗、能源、交通、供水、金融、选举等)。
  • 制作恶意软件、未授权访问他人系统。
  • 武器、军事系统或自主武器相关研发。
  • 煽动暴力、对受保护群体的仇恨言论。
  • 侵犯隐私、骚扰、跟踪、身份盗用。
  • 儿童性剥削(CSAM)或将未成年人性化的内容。
  • 用于经济、政治、公共卫生等领域的有组织虚假信息。
  • 预测性执法、量刑决策、大规模监控。
  • 欺诈、冒名、剥削性金融行为。
  • 滥用平台、绕过安全机制或速率限制。
  • 未经合法目的的露骨色情内容。

高风险场景额外要求

下列场景必须满足:(1) 由专业人士审核最终决策;(2) 向用户披露 AI 参与生成。

  • 法律建议或具有法律影响的决策。
  • 医疗 / 健康相关诊断与建议。
  • 保险承保与理赔决策。
  • 金融决策与投资建议。
  • 就业、住房资格审查。
  • 升学考试与录取相关。
  • 面向公众自动生成的新闻内容。

服务条款

正式合同建议涵盖以下条款,可根据公司主体与适用法律自行修改。

  • 服务范围:授予客户使用 API 的非排他性权利;明确禁止逆向工程、转售或与服务直接竞争。
  • 内容归属:客户保留输入所有权;输出归属由协议显式约定,常见做法是输出归属于客户、提供方不会使用客户内容训练模型。
  • 数据隐私:以数据处理协议(DPA)为准,列明子处理方、数据保留与删除策略。
  • 合规要求:客户须遵守 AUP、支持地区策略;产品向最终用户披露 AI 参与并提示输出可能不准确。
  • 付款与退款:按照定价页费率结算,价格调整提前通知;逾期可暂停或终止服务。
  • 终止条款:双方均可在合理期限内终止;重大违约保留补救期;保留条款(保密、责任)在终止后继续生效。
  • 争议解决:先内部协商,再仲裁或司法诉讼,按所在司法辖区调整。
  • 责任限额:排除间接、附带、后果性损失;总责任以前 12 个月费用为上限(除知识产权赔偿等例外)。
  • 赔偿:提供方对授权使用过程中的知识产权侵权进行抗辩;客户对其输入或违规行为进行反向赔偿。

服务专属条款

除通用条款外,针对特定服务建议补充以下子条款。

  • 团队 / 企业版:管理员需向最终用户披露所使用的服务及隐私政策。
  • Beta 服务:仅供非生产用途,提供方对 Beta 服务的总责任有上限(例如 1000 美元或近 12 个月费用之较小者)。
  • 微调服务:客户可使用自有数据进行微调,明确该数据不视为违反训练限制。
  • 云托管:通过 AWS Bedrock / Vertex AI 等云厂商运行,客户须同时遵守云厂商的政策。
  • API 限制:明确速率、配额、缓存、监控要求。
  • SLA 与数据保留:声明月度可用率(如 99.9%)、备份策略、合同终止后的数据删除。
  • 开发者合作计划:客户可选择性同意将其数据用于产品改进或模型训练。

支持地区

对外商业 API 服务覆盖大量国家与地区,下面是常见示例,最终以你部署的支持地区清单为准:

欧洲

德国、法国、英国、西班牙、意大利、北欧国家、冰岛等。

亚太

日本、韩国、印度、新加坡、澳大利亚、新西兰等。

美洲

美国、加拿大、巴西、墨西哥、阿根廷等。

非洲

南非、埃及、肯尼亚、尼日利亚等。

中东

阿联酋、沙特阿拉伯、以色列、卡塔尔等。

未列出地区

请联系运营评估是否支持,部分地区可能存在额外限制。

运营建议

对外运营时建议补充服务条款、可接受使用政策、隐私政策和地区支持说明。团队内部部署也应明确密钥保管和日志留存规则。

可接受使用

定义禁止请求类型、滥用处理方式和账户停用条件。

隐私与日志

说明请求日志、错误日志、用户信息和账单数据的保留策略。

服务可用性

说明上游渠道故障、维护窗口、退款 / 补偿边界。