import BetaNotice from '@pages/components/BetaNotice' import CodeEditor from '@pages/components/CodeEditor' export default function ModelIntegration() { return (

模型接入

当前支持符合 OpenAI 接口规范且支持 tool call 的模型,包括公有云服务和私有部署方案。

兼容性说明

🔌 OpenAI 接口兼容

支持所有遵循 OpenAI API chat/completions 接口规范的服务,包括但不限于 OpenAI、Azure 阿里云等各大云厂商的模型服务,以及使用 vLLM、Ollama 等框架部署的私有模型。

模型需要支持 tool call ,并且能够通过 json schema 制定 tool call 格式。

推荐模型

⚡ gpt-4.1-mini

评估基准 ✅

  • • 性价比高
  • • 速度快,成功率较高
  • • i/o $0.4/$1.6 (每 M token)

🚀 gpt-4.1

适用于生产

  • • 效果和速度均衡
  • • 价格贵,4.1-mini 的 5 倍
  • • 适合不缺钱的生产环境

🛡️ qwen3

合规,低成本

  • • 安全合规
  • • ToolCall 有出错率,自动重试
  • • 适合能给出详细步骤的场景

可用模型

✅ 已验证可用

gpt-4.1-mini/4.1 gpt-5 grok-4/grok-code-fast qwen3 deepseek-v3.1/3.2 claude-4-sonnet/4.5/3.7/haiku-4.5

问题

🚫 根据你的场景斟酌

  • reasoning 模型,速度偏慢,没有必要
  • GPT-5 全系列,速度过慢,效果提升不明显
  • 未针对 agent 优化的模型(如各类 coder 模型),效果不佳
  • 不保证 json schema 的模型(openAI 以外的几乎所有模型),tool call 有概率出错,需要频繁重试
  • 小模型、nano 模型,效果不佳
  • TODO: Gemini 官方提供的 OpenAI 接口 tool call 部分不兼容

配置方式

) }