模型列表

控制台的模型广场可以直接查看当前可用模型和价格：https://xiaolan.ainb.plus/pricing

如果你只想在脚本里先拉一遍可用模型，也可以直接请求接口。

第一次接入时，很多人会把“模型广场”和“模型列表接口”当成同一件事。可以简单这样理解：

模型广场：更适合人看，确认模型名、价格、分组、可用状态
模型列表接口：更适合程序看，确认当前这把 Key 实际能拿到哪些 id

第一次接入时，先看模型广场，再看模型接口，通常最省时间：

在模型广场确认目标模型确实存在
复制完整模型名
再用 /v1/models 看当前这把 Key 实际能不能看到它

这样做能把“模型本来就没有”和“当前这把 Key 没权限看到”分开。

列出模型 GET

bash

curl https://xiaolan.ainb.plus/v1/models \
  -H "Authorization: Bearer <你的 API Key>"

更易复制的写法：

bash

curl https://xiaolan.ainb.plus/v1/models \
  -H "Authorization: Bearer sk-你的专属Key"

如果你本机装了 jq，也可以直接只看模型 ID：

bash

curl -s https://xiaolan.ainb.plus/v1/models \
  -H "Authorization: Bearer sk-你的专属Key" | jq -r '.data[].id'

这样做的好处是不用在一大段 JSON 里来回找。
第一次排查“这把 Key 到底看得到哪些模型”时，jq 这一种写法通常最省时间。

响应里看什么

重点看：

id：实际调用时要写的模型名
object：通常是 model
返回数量：当前 Key 能看到多少模型

第一次排障时，id 是最重要的字段。
客户端、脚本、CLI 最终真正需要填写的，都是这里返回的 id。

常见响应结构：

json

{
  "object": "list",
  "data": [
    {
      "id": "从模型广场复制的实际模型名",
      "object": "model"
    }
  ]
}

调用聊天、图像、音频等接口时，model 字段就填这里的 id。

也就是说，接口里返回的 id 才是你真正应该复制到脚本和客户端里的内容。

如果某个客户端内置了一堆旧模型名，也不要优先相信客户端下拉框。
模型广场和 /v1/models 返回的结果，通常更接近当前实际可用状态。

怎么选择模型

模型选择先看任务，再看成本和上下文长度。第一次接入时不要直接选择最贵或最重的模型，先用轻量模型确认 Key、分组和 Base URL 都正确。

场景	选择思路	说明
第一次测试	轻量聊天模型	成本低，适合验证链路
Claude Code / Codex 写代码	代码能力强、上下文较长的模型	更适合读文件、改代码、解释报错
Cherry Studio 日常聊天	响应快、价格低的聊天模型	适合问答、翻译、总结
长文档总结	长上下文模型	避免文档过长导致截断
批量脚本	低成本模型	配合额度上限使用
向量检索	Embedding 模型	不能用聊天模型替代
文档排序	Rerank 模型	用于检索结果二次排序

模型广场里通常会显示模型名、分组、价格和可用状态。复制模型名时，连同日期、后缀和大小写一起复制。

如果你在客户端里看到“自动拉取模型列表”，本质上通常也是在做这件事：
向当前 Base URL 发一遍 GET /v1/models，然后把 data[].id 填进下拉框。

分组和模型的关系

分组会影响你能看到和调用哪些模型。创建 Key 时选择的分组，应该和模型广场里目标模型可用的分组匹配。

这里最容易混淆的是三层：

模型广场：告诉你系统里有哪些模型
Key 分组 / 模型权限：决定你这把 Key 能不能看到、能不能调用
客户端里的 model 字段：决定你这一次请求到底要调哪一个

常见判断方式：

先在模型广场找到目标模型。
查看该模型支持的分组和价格。
创建 Key 时选择能使用该模型的分组。
在客户端里填写模型广场复制的完整模型名。
如果调用时报 model not found，回到令牌管理检查分组和模型权限。

个人首次接入可以先选 auto 或默认分组。共享 Key 或批量任务再收紧到具体分组和具体模型。

不同协议的模型列表

小蓝中转站会根据请求头识别部分协议格式：

OpenAI 兼容工具：请求 /v1/models
Claude 兼容工具：带 x-api-key 和 anthropic-version
Gemini 兼容工具：请求 /v1beta/models 或带 Gemini 相关鉴权参数

普通用户和大多数桌面客户端只需要 /v1/models。

这里顺手记一个边界会更不容易混淆：

你在 Cherry Studio、Alma、OpenAI SDK 里拉模型，通常看的就是 /v1/models
你在 Claude Code、Gemini CLI 这类非 OpenAI 兼容工具里，模型获取和鉴权方式可能完全不是这一套

所以“/v1/models 能拿到列表”只能证明 OpenAI 兼容链路正常，不能自动推出所有协议的 CLI 都已经配置完成。

为什么有时接口返回的模型比模型广场少

最常见的原因不是接口坏了，而是当前这把 Key 的可见范围更窄，例如：

当前分组不包含目标模型
当前 Key 被收紧了模型权限
某个模型正在维护或暂时下线

所以排障顺序通常是：

先看模型广场有没有这个模型
再看当前分组是否能用
再看这把 Key 的模型权限是否放开
最后再回接口里重新拉一次列表

如果你刚改过 Key 权限，桌面客户端或长会话工具可能还在沿用旧缓存。
这时候不要只盯着客户端的旧下拉框，先重新拉一次 /v1/models，再决定是不是客户端本地缓存没刷新。

使用建议

模型名不要手敲，直接复制
不同 Key 能看到的列表可能不同
价格直接去模型广场看更方便
模型广场下线或维护中的模型，不要继续写进脚本
先用轻量模型跑通，再切高阶模型
不确定时，先用 /v1/models 验证当前 Key 实际可见范围

常见问题

模型广场有，接口里没有

通常是这把 Key 的权限组不包含该模型。回控制台检查令牌权限，或换一把权限更完整的 Key。

接口里有，调用时报模型不存在

先检查请求里的模型名是否完整复制。模型名大小写、日期后缀、连接符都要一致。

如果你用的是桌面客户端，还要再看一眼它保存的是不是旧模型。
不少客户端第一次导入模型后会把模型列表缓存在本地，后台权限已经改过了，客户端还在继续用旧值。

不知道选哪个模型

先按任务选：

日常聊天：轻量模型
代码生成：Claude / GPT 系列强模型
长文总结：Gemini / 长上下文模型
向量检索：Embedding 模型
文档排序：Rerank 模型

仍不确定时，先用轻量模型跑通，再按任务切换。

客户端有“自动获取模型”按钮，还要不要手动拉接口

一般不必重复做两遍。
桌面客户端能正常自动获取时，优先用客户端内置按钮；只有在客户端拿不到模型、你又想确认是不是 Key 权限问题时，再手动请求 /v1/models。

模型列表 ​

列出模型 GET ​

响应里看什么 ​

怎么选择模型 ​

分组和模型的关系 ​

不同协议的模型列表 ​

为什么有时接口返回的模型比模型广场少 ​

使用建议 ​

常见问题 ​

模型广场有，接口里没有 ​

接口里有，调用时报模型不存在 ​

不知道选哪个模型 ​

客户端有“自动获取模型”按钮，还要不要手动拉接口 ​

下一步 ​

模型列表

列出模型 GET

响应里看什么

怎么选择模型

分组和模型的关系

不同协议的模型列表

为什么有时接口返回的模型比模型广场少

使用建议

常见问题

模型广场有，接口里没有

接口里有，调用时报模型不存在

不知道选哪个模型

客户端有“自动获取模型”按钮，还要不要手动拉接口

下一步