如何选择模型

选模型不要从厂商开始。先从任务开始，再看质量、成本、速度和上下文长度。

30 秒选型

我要先跑通 API

选一个低成本文本模型，先调用 /v1/chat/completions。

我要做代码或 Agent

优先看文本模型、代码能力、上下文长度和输出价格。

我要做知识库

使用 Embedding 做召回，再用 Rerank 提升结果排序。

我要做图片或视频

图片走图像接口，视频走任务流程。先确认模型类型和接口格式。

决策矩阵

场景	优先级	选择建议
首次接入	成功率、低成本	选低成本文本模型，先验证 API Key、Base URL 和请求格式。
客服和问答	成本、稳定性、中文表现	选中文表现稳定、输出价格可控的文本模型。
代码生成	代码能力、上下文长度	选代码能力强的文本模型。长仓库任务要看上下文长度。
长文档处理	上下文长度、输入价格	选长上下文模型，并减少无关输入。
RAG	向量质量、排序质量	Embedding 负责召回，Rerank 负责精排。
图片生成	画面质量、风格控制	创意视觉可看 Midjourney。OpenAI 兼容图片适合统一接口。
视频生成	任务格式、时长、尺寸	先选择 OpenAI 兼容视频或官方视频格式，再选模型。
成本敏感批处理	输入 / 输出价格	选择 mini、lite、flash 或轻量模型，并限制输出长度。

模型名应该可替换

生产环境建议把模型名放在配置里。

AGICTO_CHAT_MODEL=MODEL_NAME
AGICTO_EMBEDDING_MODEL=MODEL_NAME
AGICTO_RERANK_MODEL=MODEL_NAME
AGICTO_IMAGE_MODEL=MODEL_NAME
AGICTO_VIDEO_MODEL=MODEL_NAME

调用时读取配置：

const completion = await client.chat.completions.create({
  model: process.env.AGICTO_CHAT_MODEL,
  messages: [
    {
      role: "user",
      content: "总结这段文本。"
    }
  ]
});

常见错误

把厂商名当成模型名

Open AI、Google、DeepSeek 是厂商或筛选项，不一定是可调用的 model。请从模型列表复制完整模型名。

模型类型和接口不匹配

图片模型不能放进 /v1/chat/completions。视频模型通常需要任务接口。向量模型要用 /v1/embeddings。

只看单价，不看输入输出长度

成本由模型单价、输入长度、输出长度和调用次数共同决定。长上下文任务尤其要关注输入价格。

开始使用

模型与价格

按场景接入

应用集成

AI 编程工具

30 秒选型

我要先跑通 API

我要做代码或 Agent

我要做知识库

我要做图片或视频

决策矩阵

推荐流程

模型名应该可替换

常见错误

开始使用

模型与价格

按场景接入

应用集成

AI 编程工具

​30 秒选型

我要先跑通 API

我要做代码或 Agent

我要做知识库

我要做图片或视频

​决策矩阵

​推荐流程

​模型名应该可替换

​常见错误

30 秒选型

决策矩阵

推荐流程

模型名应该可替换

常见错误