模型列表
控制台的模型广场可以直接查看当前可用模型和价格:https://xiaolan.ainb.plus/pricing
如果你只想在脚本里先拉一遍可用模型,也可以直接请求接口。
第一次接入时,很多人会把“模型广场”和“模型列表接口”当成同一件事。可以简单这样理解:
- 模型广场:更适合人看,确认模型名、价格、分组、可用状态
- 模型列表接口:更适合程序看,确认当前这把 Key 实际能拿到哪些
id
第一次接入时,先看模型广场,再看模型接口,通常最省时间:
- 在模型广场确认目标模型确实存在
- 复制完整模型名
- 再用
/v1/models看当前这把 Key 实际能不能看到它
这样做能把“模型本来就没有”和“当前这把 Key 没权限看到”分开。
列出模型 GET
bash
curl https://xiaolan.ainb.plus/v1/models \
-H "Authorization: Bearer <你的 API Key>"更易复制的写法:
bash
curl https://xiaolan.ainb.plus/v1/models \
-H "Authorization: Bearer sk-你的专属Key"如果你本机装了 jq,也可以直接只看模型 ID:
bash
curl -s https://xiaolan.ainb.plus/v1/models \
-H "Authorization: Bearer sk-你的专属Key" | jq -r '.data[].id'这样做的好处是不用在一大段 JSON 里来回找。
第一次排查“这把 Key 到底看得到哪些模型”时,jq 这一种写法通常最省时间。
响应里看什么
重点看:
id:实际调用时要写的模型名object:通常是model- 返回数量:当前 Key 能看到多少模型
第一次排障时,id 是最重要的字段。
客户端、脚本、CLI 最终真正需要填写的,都是这里返回的 id。
常见响应结构:
json
{
"object": "list",
"data": [
{
"id": "从模型广场复制的实际模型名",
"object": "model"
}
]
}调用聊天、图像、音频等接口时,model 字段就填这里的 id。
也就是说,接口里返回的 id 才是你真正应该复制到脚本和客户端里的内容。
如果某个客户端内置了一堆旧模型名,也不要优先相信客户端下拉框。
模型广场和 /v1/models 返回的结果,通常更接近当前实际可用状态。
怎么选择模型
模型选择先看任务,再看成本和上下文长度。第一次接入时不要直接选择最贵或最重的模型,先用轻量模型确认 Key、分组和 Base URL 都正确。
| 场景 | 选择思路 | 说明 |
|---|---|---|
| 第一次测试 | 轻量聊天模型 | 成本低,适合验证链路 |
| Claude Code / Codex 写代码 | 代码能力强、上下文较长的模型 | 更适合读文件、改代码、解释报错 |
| Cherry Studio 日常聊天 | 响应快、价格低的聊天模型 | 适合问答、翻译、总结 |
| 长文档总结 | 长上下文模型 | 避免文档过长导致截断 |
| 批量脚本 | 低成本模型 | 配合额度上限使用 |
| 向量检索 | Embedding 模型 | 不能用聊天模型替代 |
| 文档排序 | Rerank 模型 | 用于检索结果二次排序 |
模型广场里通常会显示模型名、分组、价格和可用状态。复制模型名时,连同日期、后缀和大小写一起复制。
如果你在客户端里看到“自动拉取模型列表”,本质上通常也是在做这件事:
向当前 Base URL 发一遍 GET /v1/models,然后把 data[].id 填进下拉框。
分组和模型的关系
分组会影响你能看到和调用哪些模型。创建 Key 时选择的分组,应该和模型广场里目标模型可用的分组匹配。
这里最容易混淆的是三层:
- 模型广场:告诉你系统里有哪些模型
- Key 分组 / 模型权限:决定你这把 Key 能不能看到、能不能调用
- 客户端里的
model字段:决定你这一次请求到底要调哪一个
常见判断方式:
- 先在模型广场找到目标模型。
- 查看该模型支持的分组和价格。
- 创建 Key 时选择能使用该模型的分组。
- 在客户端里填写模型广场复制的完整模型名。
- 如果调用时报
model not found,回到令牌管理检查分组和模型权限。
个人首次接入可以先选 auto 或默认分组。共享 Key 或批量任务再收紧到具体分组和具体模型。
不同协议的模型列表
小蓝中转站 会根据请求头识别部分协议格式:
- OpenAI 兼容工具:请求
/v1/models - Claude 兼容工具:带
x-api-key和anthropic-version - Gemini 兼容工具:请求
/v1beta/models或带 Gemini 相关鉴权参数
普通用户和大多数桌面客户端只需要 /v1/models。
这里顺手记一个边界会更不容易混淆:
- 你在 Cherry Studio、Alma、OpenAI SDK 里拉模型,通常看的就是
/v1/models - 你在 Claude Code、Gemini CLI 这类非 OpenAI 兼容工具里,模型获取和鉴权方式可能完全不是这一套
所以“/v1/models 能拿到列表”只能证明 OpenAI 兼容链路正常,不能自动推出所有协议的 CLI 都已经配置完成。
为什么有时接口返回的模型比模型广场少
最常见的原因不是接口坏了,而是当前这把 Key 的可见范围更窄,例如:
- 当前分组不包含目标模型
- 当前 Key 被收紧了模型权限
- 某个模型正在维护或暂时下线
所以排障顺序通常是:
- 先看模型广场有没有这个模型
- 再看当前分组是否能用
- 再看这把 Key 的模型权限是否放开
- 最后再回接口里重新拉一次列表
如果你刚改过 Key 权限,桌面客户端或长会话工具可能还在沿用旧缓存。
这时候不要只盯着客户端的旧下拉框,先重新拉一次 /v1/models,再决定是不是客户端本地缓存没刷新。
使用建议
- 模型名不要手敲,直接复制
- 不同 Key 能看到的列表可能不同
- 价格直接去模型广场看更方便
- 模型广场下线或维护中的模型,不要继续写进脚本
- 先用轻量模型跑通,再切高阶模型
- 不确定时,先用
/v1/models验证当前 Key 实际可见范围
常见问题
模型广场有,接口里没有
通常是这把 Key 的权限组不包含该模型。回控制台检查令牌权限,或换一把权限更完整的 Key。
接口里有,调用时报模型不存在
先检查请求里的模型名是否完整复制。模型名大小写、日期后缀、连接符都要一致。
如果你用的是桌面客户端,还要再看一眼它保存的是不是旧模型。
不少客户端第一次导入模型后会把模型列表缓存在本地,后台权限已经改过了,客户端还在继续用旧值。
不知道选哪个模型
先按任务选:
- 日常聊天:轻量模型
- 代码生成:Claude / GPT 系列强模型
- 长文总结:Gemini / 长上下文模型
- 向量检索:Embedding 模型
- 文档排序:Rerank 模型
仍不确定时,先用轻量模型跑通,再按任务切换。
客户端有“自动获取模型”按钮,还要不要手动拉接口
一般不必重复做两遍。
桌面客户端能正常自动获取时,优先用客户端内置按钮;只有在客户端拿不到模型、你又想确认是不是 Key 权限问题时,再手动请求 /v1/models。