Skip to content
Ask

快速开始

本页是一份从控制台到 API 调用、第三方工具接入、日志排查和生产上线的完整接入流程。第一次接入建议按顺序完成;已有经验的开发者可以直接跳到「开发者接入」。

接入路径

  1. 登录 Xima AI 控制台。
  2. 查看账号余额、可用模型和模型价格。
  3. 创建 API Key,并按用途设置额度、权限或有效期。
  4. 用 cURL 完成一次最小请求。
  5. 在日志页面确认请求、模型、tokens 和费用。
  6. 再接入 SDK、第三方客户端、代码编辑器或工作流平台。

接入前准备

你需要准备三项信息:

信息示例获取方式
Base URLhttps://console.xima.ai/v1控制台连接信息或本文示例
API Keysk-xxxxxxxx控制台「令牌」或「API Key」页面创建
Modelazure/gpt-5.4-mini从控制台「模型与定价」页面复制

请求头固定格式:

http
Authorization: Bearer sk-替换为你的APIKey
Content-Type: application/json

WARNING

模型 ID 请从控制台复制,不要手写。版本号、大小写、日期后缀和分隔符都必须完全一致。

控制台快速开始

1. 登录控制台

打开 Xima AI 控制台 并完成登录。

Xima AI 控制台首页

首次登录后建议确认:

  • 账户余额或额度是否正常。
  • 当前账号可用哪些模型。
  • 是否可以创建并复制 sk-... 格式的 API Key。
  • 是否可以在「日志」页面看到一次测试调用记录。

2. 查看模型和价格

进入控制台的「模型与定价」页面,重点查看:

  • 模型名称:接入时填写到请求体的 model 字段,必须复制完整模型名。
  • 模型能力:聊天、视觉、向量、图片生成、视频生成等能力可能对应不同接口。
  • 计费项:输入、输出、缓存读取、缓存创建、图片输入、音频输入或按秒计费。
  • 可用状态:如果账号暂时不可用该模型,请更换可用模型或联系支持。

公开文档中的价格统一维护在 模型与价格。快速开始不再重复价格表,避免多个页面价格不同步。

模型名常见注意事项:

  • 不要把连字符 - 手写成点号 .
  • 不要漏掉日期、版本号或后缀。
  • 不要把客户端里的展示名当作真实模型名。
  • 如果客户端没有自动拉取模型,请从控制台复制后手动添加。

3. 创建 API Key

进入控制台的「令牌」或「API Key」管理页面,点击创建或添加令牌。

进入令牌管理并点击添加令牌

建议按用途命名,例如:

  • personal-test
  • cursor-dev
  • nextchat-mobile
  • lobe-chat
  • cherry-studio
  • dify-workflow
  • prod-server

创建时建议检查以下配置:

配置项建议
名称按用途命名,方便日志排查
额度测试、演示、第三方工具建议设置固定额度上限
有效期临时测试 Key 设置较短有效期
模型限制只开放当前场景需要的模型
IP 白名单生产服务端固定出口 IP 时可以启用

创建新的 API Key 并设置分组、过期时间和额度

创建后请立即复制并保存完整 Key。Key 等同于调用权限,不要放进前端代码、移动端包体、公开仓库、截图或公开日志。

如果怀疑 Key 泄露,立即禁用或删除旧 Key,再重新创建。

4. 查看额度和余额

进入控制台的「数据看板」或「钱包管理」页面,确认:

  • 主账户余额是否充足。
  • 当前 API Key 是否设置了额度上限。
  • 当前 API Key 是否还有剩余额度。
  • 高价模型、长上下文、多轮对话和高并发任务是否会导致额度快速消耗。

如果充值或兑换后未到账,保留订单号、兑换码和截图后联系 Xima AI 支持。

5. 用日志确认调用是否成功

进入控制台的「使用日志」或「日志」页面。日志页面用于确认:

  • 请求是否真正到达 Xima AI。
  • 使用的是哪个 API Key。
  • 调用的是哪个模型。
  • 输入 tokens、输出 tokens、缓存 tokens 和费用是否正常。
  • 失败请求的状态码、错误信息和 Raw Error。

如果客户端提示「连接失败」,第一步先看日志是否有请求记录:

日志情况判断
日志没有记录请求没有到达 Xima AI,优先检查 Base URL、网络、代理、客户端 Provider 和 Authorization
日志有失败记录查看状态码、模型名、tokens 和错误详情
日志有 Raw Error截图或复制 Raw Error 后再联系支持

开发者接入

接口路径

Xima AI 通常兼容 OpenAI 风格接口,常见路径如下:

能力路径完整示例
聊天补全/chat/completionshttps://console.xima.ai/v1/chat/completions
模型列表/modelshttps://console.xima.ai/v1/models
向量嵌入/embeddingshttps://console.xima.ai/v1/embeddings
图片生成/images/generationshttps://console.xima.ai/v1/images/generations

如果某个路径返回 404、模型不存在或能力不支持,请以控制台文档和模型说明为准。

配置环境变量

建议把 Base URL、API Key 和默认模型放到环境变量中:

bash
export XIMA_BASE_URL="https://console.xima.ai/v1"
export XIMA_API_KEY="sk-替换为你的APIKey"
export XIMA_MODEL="azure/gpt-5.4-mini"

如果你从控制台复制到的 Base URL 已经包含 /v1,请求路径只需要继续拼接 /chat/completions,不要写成 /v1/v1/chat/completions

cURL 最小测试

先用非流式请求测试连通性:

bash
curl "$XIMA_BASE_URL/chat/completions" \
  -H "Authorization: Bearer $XIMA_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "'"$XIMA_MODEL"'",
    "messages": [
      {
        "role": "user",
        "content": "你好,请用一句话介绍 Xima AI。"
      }
    ],
    "temperature": 0.7
  }'

如果 cURL 成功,说明 Base URL、API Key、模型名和网络基本可用;如果第三方客户端仍失败,优先排查客户端配置。

查询模型列表:

bash
curl "$XIMA_BASE_URL/models" \
  -H "Authorization: Bearer $XIMA_API_KEY"

Python 接入

安装依赖:

bash
pip install openai

示例代码:

python
import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["XIMA_API_KEY"],
    base_url=os.environ.get("XIMA_BASE_URL", "https://console.xima.ai/v1"),
)

response = client.chat.completions.create(
    model=os.environ.get("XIMA_MODEL", "azure/gpt-5.4-mini"),
    messages=[
        {"role": "user", "content": "测试一下连接是否正常。"}
    ],
)

print(response.choices[0].message.content)

Python 流式输出

python
import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["XIMA_API_KEY"],
    base_url=os.environ.get("XIMA_BASE_URL", "https://console.xima.ai/v1"),
)

stream = client.chat.completions.create(
    model=os.environ.get("XIMA_MODEL", "azure/gpt-5.4-mini"),
    messages=[
        {"role": "user", "content": "请分三点说明流式输出的好处。"}
    ],
    stream=True,
)

for chunk in stream:
    delta = chunk.choices[0].delta.content
    if delta:
        print(delta, end="", flush=True)

Node.js 接入

安装依赖:

bash
npm install openai

示例代码:

js
import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.XIMA_API_KEY,
  baseURL: process.env.XIMA_BASE_URL || "https://console.xima.ai/v1"
});

const response = await client.chat.completions.create({
  model: process.env.XIMA_MODEL || "azure/gpt-5.4-mini",
  messages: [
    { role: "user", content: "测试一下连接是否正常。" }
  ]
});

console.log(response.choices[0].message.content);

cURL 流式输出

聊天产品、长文本生成和 Agent 场景通常建议开启流式输出:

bash
curl -N "$XIMA_BASE_URL/chat/completions" \
  -H "Authorization: Bearer $XIMA_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "'"$XIMA_MODEL"'",
    "messages": [
      {
        "role": "user",
        "content": "请分三点说明流式输出的好处。"
      }
    ],
    "stream": true
  }'

客户端需要按 Server-Sent Events 逐段读取返回内容。生产环境建议先用非流式请求打通,再开启 stream: true

Embedding 示例

向量模型使用 /embeddings 路径:

bash
curl "$XIMA_BASE_URL/embeddings" \
  -H "Authorization: Bearer $XIMA_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "azure/text-embedding-3-small",
    "input": "Xima AI 统一模型网关"
  }'

Embedding 只按输入 tokens 计费,具体价格以 模型与价格 和控制台用量明细为准。

第三方工具接入

独立 AI 客户端

适用于 NextChat、LobeChat、Chatbox、Cherry Studio、OpenWebUI 等支持 OpenAI 兼容接口的客户端。

通用填写方式:

配置项填写内容
Provider / 供应商OpenAI Compatible、自定义 OpenAI、自定义 API 等
API Base / Base URLhttps://console.xima.ai/v1
API Key控制台创建的 sk-...
Model从 Xima AI 控制台复制模型名称

注意事项:

  • Base URL 末尾通常需要带 /v1
  • 如果客户端没有自动拉取模型列表,请在「自定义模型」中手动输入控制台模型名。
  • 如果同一个客户端里有多个 Provider,确认当前对话选中的是 Xima AI 对应配置。
  • 接入后先发一句短消息测试,再到 Xima AI 日志页确认请求记录。

AI 代码编辑器

适用于 Cursor 一类代码编辑器:

  1. 打开设置中的模型或 API 配置页。
  2. 选择 OpenAI Compatible、OpenAI Override 或自定义 OpenAI 方式。
  3. Base URL 填写 https://console.xima.ai/v1
  4. API Key 填写 sk-...
  5. 在模型列表中开启或手动添加你要使用的模型。
  6. 保存后发起一次短测试。
  7. 回到 Xima AI 日志页确认请求是否到达。

常见问题:

  • 只填了 API Key,忘记打开模型开关。
  • 模型名称和控制台展示不一致。
  • Base URL 漏写 /v1 或重复写了 /v1/v1
  • 编辑器里有多个 Provider,当前会话没有选中 Xima AI 对应配置。

Dify / 工作流平台

适用于 Dify、n8n、Coze 等可配置 OpenAI 兼容接口的平台。

通用步骤:

  1. 新增模型供应商,选择 OpenAI Compatible 或自定义 OpenAI。
  2. API Base 填写 https://console.xima.ai/v1
  3. API Key 填写控制台创建的 sk-...
  4. 手动添加模型名称,或通过模型列表接口拉取。
  5. 先创建一个最小测试节点,只发送一句短文本。
  6. 测试成功后再接入长工作流、文件解析、多轮对话或批量任务。

建议:

  • 给工作流平台单独创建一个 API Key。
  • 给该 Key 设置额度上限。
  • 避免工作流失败后无限重试。
  • 失败时先到 Xima AI 日志页查看是否有请求记录。

CC Switch

如果控制台令牌页提供 CC Switch 导入入口,可按以下方式操作:

  1. 在「令牌管理」页面,选择需要操作的令牌。
  2. 选择 CC Switch。

在令牌管理中选择 CC Switch

  1. 选择需要导入的 CLI,例如 Claude CLI、Codex 或 Gemini。
  2. 选择导入的模型。
  3. 点击打开 CC Switch,通过唤起应用自动导入。

选择需要导入的 CLI 和模型

浏览器确认打开 CC Switch

在 CC Switch 中确认并导入配置

如果唤起失败,优先检查本地是否已安装 CC Switch,以及浏览器是否允许打开外部应用。

常见报错速查

状态码 / 报错常见表现优先检查
400 Bad Requestinvalid_request_errormodel_not_found、参数错误模型名、JSON 格式、messages、上下文长度、模型能力
401 UnauthorizedInvalid API Key、身份验证失败API Key 是否完整、是否有空格、请求头格式、Key 是否被禁用
403 ForbiddenTotal quota is not enoughToken quota is not enoughinsufficient_quota主账户余额、Key 额度、模型权限、IP 白名单
404 Not Found接口不存在、模型不存在Base URL、接口路径、模型名、是否重复 /v1
408 Timeout / timeout请求超时、连接失败网络、代理、DNS、输入长度、客户端 timeout
429 Too Many RequestsRate limit reachedRequests too frequent请求频率、并发、RPM、TPM、重试策略
500 Internal Server ErrorInternal Server ErrorBad Gateway平台或上游渠道异常,查看 Raw Error
503 Service UnavailableNo available channels、服务不可用当前模型无健康渠道,换模型并联系支持
上下文过长context_length_exceeded输入内容、历史对话、文档长度、max_tokens
返回为空或截断输出为空、内容突然停止max_tokensstop、流式读取逻辑
CORS / 浏览器跨域浏览器前端直接请求失败不要在浏览器暴露 API Key,改用后端转发
日志无记录客户端报错但控制台无日志请求没有到 Xima AI,查 Base URL、网络、客户端 Provider

常见报错处理

400 Bad Request / 请求错误

常见原因:

  • 模型名称写错或不完整。
  • messages 格式不正确。
  • JSON 格式错误。
  • 参数类型错误,例如把数字写成字符串。
  • 当前模型不支持图片、工具调用、JSON 模式或其他特殊参数。
  • 历史对话太长,或 max_tokens 设置过高。

处理方式:

  1. 用本文 cURL 示例做最小请求测试。
  2. 从控制台复制模型名,不要手写。
  3. 确认 messages 是数组,且每条消息包含 rolecontent
  4. 删除不确定的高级参数,只保留 modelmessagestemperature
  5. 如果是上下文超限,缩短输入、裁剪历史或降低 max_tokens
  6. 如果是多模态请求,确认模型确实支持图片、音频或文件输入。

401 Unauthorized / 凭证无效

常见原因:

  • API Key 填错、少复制字符或包含多余空格。
  • 请求头不是 Authorization: Bearer sk-...
  • Key 已被禁用、删除或过期。
  • Base URL 写错,请求发到了其他服务。
  • 当前账号状态受限。

处理方式:

  1. 重新复制控制台中的 sk-...
  2. 确认请求头格式为 Authorization: Bearer sk-你的APIKey
  3. 确认 Base URL 为 https://console.xima.ai/v1
  4. 新建一个测试 Key 重新验证。
  5. 若仍失败,查看日志或联系 Xima AI 支持确认账号状态。

403 Forbidden / 无权限或额度不足

常见原因:

  • 主账户余额不足。
  • 当前 Key 额度耗尽。
  • 当前账号没有该模型权限。
  • Key 设置了模型限制、分组限制或 IP 白名单。
  • 调用来源 IP 不在白名单内。

处理方式:

  1. 到控制台检查主账户余额。
  2. 到令牌列表检查该 Key 的额度上限和剩余额度。
  3. 换一个确定可用的模型测试。
  4. 检查 Key 是否限制模型或 IP。
  5. 如需模型权限或更高额度,联系 Xima AI 支持。

404 Not Found / 接口或模型不存在

常见原因:

  • Base URL 路径错误,例如漏写 /v1
  • 重复写了 /v1/v1
  • 接口路径拼错,例如 /chat/completion 少了 s
  • 模型名称不存在。
  • 当前模型不支持所调用的接口能力。

处理方式:

  1. Base URL 使用 https://console.xima.ai/v1
  2. 聊天接口完整地址为 https://console.xima.ai/v1/chat/completions
  3. 从控制台复制模型名称。
  4. 检查客户端是否自动拼接了 /v1
  5. 到日志页面查看实际错误。

408 Timeout / 连接失败 / 请求超时

常见原因:

  • 本地网络不稳定。
  • 代理、防火墙或 DNS 异常。
  • 输入过长,模型响应慢。
  • 客户端 timeout 设置太短。
  • 平台或上游模型临时繁忙。

处理方式:

  1. 用 cURL 最小请求测试网络和 Key。
  2. 检查代理、防火墙和 DNS。
  3. 缩短输入内容,降低 max_tokens
  4. 在 SDK 或客户端中适当调大 timeout。
  5. 查看 Xima AI 日志,确认请求是否到达平台。

429 Too Many Requests / 请求过多或限流

常见原因:

  • 请求频率过高。
  • 并发过高。
  • 客户端自动重试导致请求堆积。
  • 上游模型有 RPM 或 TPM 限制。

处理方式:

  1. 降低并发和请求频率。
  2. 加入指数退避重试,例如 1 秒、2 秒、4 秒递增。
  3. 避免无限重试。
  4. 聊天客户端可等待 10-30 秒后重试。
  5. 生产业务需要更高并发时,联系 Xima AI 支持确认限额。

500 / 503 / 渠道异常

常见原因:

  • 当前模型对应的上游渠道临时不可用。
  • 上游供应商宕机、限流或返回异常。
  • 平台暂时没有健康通道可用。
  • 网络链路或网关异常。

处理方式:

  1. 先重试一次,确认是否为偶发问题。
  2. 换用另一个可用模型测试。
  3. 如果同一模型持续失败,到日志页复制错误详情或 Raw Error。
  4. 联系 Xima AI 支持,并提供请求时间、模型名、Key 名称和日志截图。

上下文过长 / Token 超限

处理方式:

  1. 缩短输入内容。
  2. 只保留最近必要的对话历史。
  3. 长文档先分段摘要,再提交给模型。
  4. 降低 max_tokens
  5. 换用上下文更长的模型。

返回内容为空或被截断

处理方式:

  1. 增大 max_tokens
  2. 检查并移除不必要的 stop 参数。
  3. 非流式调用读取 response.choices[0].message.content
  4. 流式调用时确认循环读取全部 chunk。

流式输出异常 / SSE 解析失败

处理方式:

  1. 先关闭 stream,用非流式请求验证模型可用。
  2. 确认客户端或网关支持 SSE。
  3. 正确处理 [DONE]
  4. 浏览器前端不要直接暴露 API Key,应通过后端转发。

CORS / 浏览器跨域错误

浏览器前端不要直接调用 Xima AI API,也不要在前端代码中放置 sk-...。推荐架构是:

  1. 前端调用自己的后端接口。
  2. 后端从环境变量读取 Xima AI API Key。
  3. 后端请求 Xima AI,再把安全处理后的结果返回前端。

日志里没有请求记录

常见原因:

  • 请求没有发送到 Xima AI。
  • Base URL 写错。
  • DNS、代理或网络层拦截。
  • 客户端配置保存后未生效。
  • 当前会话没有选中 Xima AI 的 Provider。

处理方式:

  1. 确认 Base URL 是 https://console.xima.ai/v1
  2. 用 cURL 直接请求测试。
  3. 检查客户端是否存在多个供应商配置。
  4. 如果 cURL 有日志而客户端没有日志,优先排查客户端配置。
  5. 重新保存客户端配置并重启客户端。

日志排查方法

当出现「能打开客户端但无法回复」「前端显示连接失败」「代码没有明显报错」等问题时,按下面顺序排查:

  1. 打开 Xima AI 控制台
  2. 进入「日志」。
  3. 按时间找到失败请求。
  4. 检查以下字段。
字段重点看什么
时间是否与你刚刚发起请求的时间一致
类型是消费、失败请求还是其他记录
令牌是否使用了正确的 sk-...
模型是否为你想调用的模型,是否拼写完全一致
状态码400、401、403、404、408、429、500、503 等
提示 Token输入内容是否异常过长
完成 Token输出是否被截断或异常为空
消耗是否符合预期,是否出现异常高额消耗
详情 / Raw Error上游返回的底层错误,联系支持时最有用

判断逻辑:

  • 日志没有记录:请求没到 Xima AI,查 Base URL、网络、代理、客户端配置。
  • 日志有 401:查 API Key 和 Authorization。
  • 日志有 403:查余额、Key 额度、模型权限和 IP 限制。
  • 日志有 400:查模型名、参数和上下文长度。
  • 日志有 429:降并发、等 10-30 秒、加入重试退避。
  • 日志有 500/503:通常是平台或上游通道异常,换模型并联系支持。

联系支持时建议提供:

  • 请求时间。
  • Key 名称,不要直接发送完整 sk-...
  • 模型名称。
  • 状态码和 Raw Error。
  • 客户端名称和 Base URL 配置截图。
  • 是否能用本文 cURL 最小请求复现。

安全与最佳实践

  • API Key 只保存在服务端、环境变量或密钥管理工具中。
  • 不要在前端网页、移动端包体、公开仓库或截图中暴露 API Key。
  • 生产环境和测试环境使用不同 Key。
  • 第三方客户端使用独立 Key,并设置额度上限。
  • 不建议给测试 Key 或第三方客户端 Key 开启无限额度。
  • 定期查看日志,关注异常高频调用、失败请求和额度消耗。
  • 如果项目下线、人员离职或怀疑泄露,及时禁用或删除相关 Key。
  • 代码调用应设置 timeout、重试次数和指数退避,避免无限重试。
  • 生产业务建议记录请求 ID、模型名、耗时、状态码和错误详情,便于排查。
  • 客户端或工作流平台中如果存在自动重试、自动续写、自动 Agent 循环,应额外设置调用上限。
  • 用于演示、测试、课程、分享的 Key 建议临时创建,用完删除。