Skip to content

模型列表

控制台的模型广场可以直接查看当前可用模型和价格:https://xiaolan.ainb.plus/pricing

如果你只想在脚本里先拉一遍可用模型,也可以直接请求接口。

第一次接入时,很多人会把“模型广场”和“模型列表接口”当成同一件事。可以简单这样理解:

  • 模型广场:更适合人看,确认模型名、价格、分组、可用状态
  • 模型列表接口:更适合程序看,确认当前这把 Key 实际能拿到哪些 id

第一次接入时,先看模型广场,再看模型接口,通常最省时间:

  1. 在模型广场确认目标模型确实存在
  2. 复制完整模型名
  3. 再用 /v1/models 看当前这把 Key 实际能不能看到它

这样做能把“模型本来就没有”和“当前这把 Key 没权限看到”分开。

列出模型 GET

bash
curl https://xiaolan.ainb.plus/v1/models \
  -H "Authorization: Bearer <你的 API Key>"

更易复制的写法:

bash
curl https://xiaolan.ainb.plus/v1/models \
  -H "Authorization: Bearer sk-你的专属Key"

如果你本机装了 jq,也可以直接只看模型 ID:

bash
curl -s https://xiaolan.ainb.plus/v1/models \
  -H "Authorization: Bearer sk-你的专属Key" | jq -r '.data[].id'

这样做的好处是不用在一大段 JSON 里来回找。
第一次排查“这把 Key 到底看得到哪些模型”时,jq 这一种写法通常最省时间。

响应里看什么

重点看:

  • id:实际调用时要写的模型名
  • object:通常是 model
  • 返回数量:当前 Key 能看到多少模型

第一次排障时,id 是最重要的字段。
客户端、脚本、CLI 最终真正需要填写的,都是这里返回的 id

常见响应结构:

json
{
  "object": "list",
  "data": [
    {
      "id": "从模型广场复制的实际模型名",
      "object": "model"
    }
  ]
}

调用聊天、图像、音频等接口时,model 字段就填这里的 id

也就是说,接口里返回的 id 才是你真正应该复制到脚本和客户端里的内容。

如果某个客户端内置了一堆旧模型名,也不要优先相信客户端下拉框。
模型广场和 /v1/models 返回的结果,通常更接近当前实际可用状态。

怎么选择模型

模型选择先看任务,再看成本和上下文长度。第一次接入时不要直接选择最贵或最重的模型,先用轻量模型确认 Key、分组和 Base URL 都正确。

场景选择思路说明
第一次测试轻量聊天模型成本低,适合验证链路
Claude Code / Codex 写代码代码能力强、上下文较长的模型更适合读文件、改代码、解释报错
Cherry Studio 日常聊天响应快、价格低的聊天模型适合问答、翻译、总结
长文档总结长上下文模型避免文档过长导致截断
批量脚本低成本模型配合额度上限使用
向量检索Embedding 模型不能用聊天模型替代
文档排序Rerank 模型用于检索结果二次排序

模型广场里通常会显示模型名、分组、价格和可用状态。复制模型名时,连同日期、后缀和大小写一起复制。

如果你在客户端里看到“自动拉取模型列表”,本质上通常也是在做这件事:
向当前 Base URL 发一遍 GET /v1/models,然后把 data[].id 填进下拉框。

分组和模型的关系

分组会影响你能看到和调用哪些模型。创建 Key 时选择的分组,应该和模型广场里目标模型可用的分组匹配。

这里最容易混淆的是三层:

  • 模型广场:告诉你系统里有哪些模型
  • Key 分组 / 模型权限:决定你这把 Key 能不能看到、能不能调用
  • 客户端里的 model 字段:决定你这一次请求到底要调哪一个

常见判断方式:

  1. 先在模型广场找到目标模型。
  2. 查看该模型支持的分组和价格。
  3. 创建 Key 时选择能使用该模型的分组。
  4. 在客户端里填写模型广场复制的完整模型名。
  5. 如果调用时报 model not found,回到令牌管理检查分组和模型权限。

个人首次接入可以先选 auto 或默认分组。共享 Key 或批量任务再收紧到具体分组和具体模型。

不同协议的模型列表

小蓝中转站 会根据请求头识别部分协议格式:

  • OpenAI 兼容工具:请求 /v1/models
  • Claude 兼容工具:带 x-api-keyanthropic-version
  • Gemini 兼容工具:请求 /v1beta/models 或带 Gemini 相关鉴权参数

普通用户和大多数桌面客户端只需要 /v1/models

这里顺手记一个边界会更不容易混淆:

  • 你在 Cherry Studio、Alma、OpenAI SDK 里拉模型,通常看的就是 /v1/models
  • 你在 Claude Code、Gemini CLI 这类非 OpenAI 兼容工具里,模型获取和鉴权方式可能完全不是这一套

所以“/v1/models 能拿到列表”只能证明 OpenAI 兼容链路正常,不能自动推出所有协议的 CLI 都已经配置完成。

为什么有时接口返回的模型比模型广场少

最常见的原因不是接口坏了,而是当前这把 Key 的可见范围更窄,例如:

  • 当前分组不包含目标模型
  • 当前 Key 被收紧了模型权限
  • 某个模型正在维护或暂时下线

所以排障顺序通常是:

  1. 先看模型广场有没有这个模型
  2. 再看当前分组是否能用
  3. 再看这把 Key 的模型权限是否放开
  4. 最后再回接口里重新拉一次列表

如果你刚改过 Key 权限,桌面客户端或长会话工具可能还在沿用旧缓存。
这时候不要只盯着客户端的旧下拉框,先重新拉一次 /v1/models,再决定是不是客户端本地缓存没刷新。

使用建议

  • 模型名不要手敲,直接复制
  • 不同 Key 能看到的列表可能不同
  • 价格直接去模型广场看更方便
  • 模型广场下线或维护中的模型,不要继续写进脚本
  • 先用轻量模型跑通,再切高阶模型
  • 不确定时,先用 /v1/models 验证当前 Key 实际可见范围

常见问题

模型广场有,接口里没有

通常是这把 Key 的权限组不包含该模型。回控制台检查令牌权限,或换一把权限更完整的 Key。

接口里有,调用时报模型不存在

先检查请求里的模型名是否完整复制。模型名大小写、日期后缀、连接符都要一致。

如果你用的是桌面客户端,还要再看一眼它保存的是不是旧模型。
不少客户端第一次导入模型后会把模型列表缓存在本地,后台权限已经改过了,客户端还在继续用旧值。

不知道选哪个模型

先按任务选:

  • 日常聊天:轻量模型
  • 代码生成:Claude / GPT 系列强模型
  • 长文总结:Gemini / 长上下文模型
  • 向量检索:Embedding 模型
  • 文档排序:Rerank 模型

仍不确定时,先用轻量模型跑通,再按任务切换。

客户端有“自动获取模型”按钮,还要不要手动拉接口

一般不必重复做两遍。
桌面客户端能正常自动获取时,优先用客户端内置按钮;只有在客户端拿不到模型、你又想确认是不是 Key 权限问题时,再手动请求 /v1/models

下一步

小蓝中转站使用文档