import BetaNotice from '@pages/components/BetaNotice' import CodeEditor from '@pages/components/CodeEditor' export default function ModelIntegration() { return (

模型接入

当前支持符合 OpenAI 接口规范且支持 tool call 的模型，包括公有云服务和私有部署方案。

兼容性说明

🔌 OpenAI 接口兼容

支持所有遵循 OpenAI API chat/completions 接口规范的服务，包括但不限于 OpenAI、Azure 阿里云等各大云厂商的模型服务，以及使用 vLLM、Ollama 等框架部署的私有模型。

模型需要支持 tool call ，并且能够通过 json schema 制定 tool call 格式。

推荐模型

⚡ gpt-4.1-mini

评估基准 ✅

• 性价比高
• 速度快，成功率较高
• i/o $0.4/$1.6 (每 M token)

🚀 gpt-4.1

适用于生产

• 效果和速度均衡
• 价格贵，4.1-mini 的 5 倍
• 适合不缺钱的生产环境

🛡️ qwen3

合规，低成本

• 安全合规
• ToolCall 有出错率，自动重试
• 适合能给出详细步骤的场景

可用模型

✅ 已验证可用

gpt-4.1-mini/4.1 gpt-5 grok-4/grok-code-fast qwen3 deepseek-v3.1/3.2 claude-4-sonnet/4.5/3.7/haiku-4.5

问题

🚫 根据你的场景斟酌

reasoning 模型，速度偏慢，没有必要
GPT-5 全系列，速度过慢，效果提升不明显
未针对 agent 优化的模型（如各类 coder 模型），效果不佳
不保证 json schema 的模型（openAI 以外的几乎所有模型），tool call 有概率出错，需要频繁重试
小模型、nano 模型，效果不佳
TODO: Gemini 官方提供的 OpenAI 接口 tool call 部分不兼容

配置方式

) }