前言

过去两年,我经历过三次AI服务供应商切换:从最初的单一供应商依赖,到发现限流和成本问题后的多供应商组合,再到现在的"可编程认知系统"架构。

这篇文章记录我当前的AI服务组合架构,以及为什么"单一供应商"在长期生产环境中是一个风险点。

一、当前架构概览

我的AI服务组合由四个供应商组成:

供应商模型主要用途接入方式
智谱AIGLM Coding Lite代码生成、技术问答API
MiniMax多种模型文本生成、创意写作API
DeepSeekDeepSeek-V3代码审查、复杂推理API
SenseNova6.7 Flash-Lite日常协作、多模态自定义提供商

核心原则:没有单一供应商承担超过40%的工作负载。

二、为什么需要多供应商

2.1 限流风险

2025年Q3,我遇到的第一个限流事件:某供应商在高峰期对API调用实施软限流,返回429错误但不提供明确的重试头信息。当时我的自动化脚本全部阻塞,等待了12分钟才恢复。

教训:单一供应商的限流策略不可控,多供应商可以自动降级。

2.2 成本优化

不同供应商的定价策略差异显著:

  • 简单任务(文本摘要、格式转换)→ 使用低价供应商
  • 中等复杂度(代码审查、技术文档)→ 使用性价比最优供应商
  • 高复杂度(架构设计、深度分析)→ 使用高能力供应商

通过任务路由,整体成本比单一使用高能力供应商降低约35%。

2.3 能力互补

没有哪个供应商在所有任务上都是最优的:

  • 代码生成:GLM Coding Lite 在小型脚本上表现优异
  • 复杂推理:DeepSeek-V3 在多步推理任务上更稳定
  • 创意写作:MiniMax 在中文创意内容上更有表现力
  • 多模态:SenseNova 在图像理解和生成上有独特优势

三、架构实现

3.1 统一接入层

我使用 Hermes Agent 作为统一接入层,配置如下:

# config.yaml 片段
providers:
  - name: glm-coding
    provider: custom:glm-coding-lite
    weight: 30
  - name: minimax
    provider: minimax
    weight: 25
  - name: deepseek
    provider: deepseek
    weight: 25
  - name: sensenova
    provider: custom:sensenova-6.7-flash-lite
    weight: 20

3.2 任务路由策略

任务类型 → 路由规则
─────────────────────────────────────
代码生成    → glm-coding (优先) → deepseek (降级)
技术问答    → deepseek (优先) → glm-coding (降级)
创意写作    → minimax (优先) → sensenova (降级)
多模态      → sensenova (唯一)
日常协作    → sensenova (优先) → 其他 (降级)

3.3 降级机制

当主供应商不可用时,自动切换到备用供应商:

  1. 检测到错误(超时、5xx、限流)
  2. 记录错误日志(用于后续分析)
  3. 切换备用供应商
  4. 通知用户(仅当所有供应商都不可用时)

四、代理环境集成

所有AI API调用都经过 Clash Meta 代理(聚合飞鸟云46节点 + 杜卡迪21节点 = 67节点),确保:

  • 网络稳定性:多节点冗余,单节点故障不影响整体
  • 地理优化:根据供应商服务器位置选择最优出口节点
  • 合规性:国内供应商走国内节点,海外供应商走海外节点

五、成本分析

项目单一供应商多供应商组合节省
月均API调用50,000次50,000次-
月均成本¥1,200¥78035%
限流事件3次/月0次/月100%
平均响应时间2.3s1.8s22%

六、总结

多供应商AI服务组合的核心价值不是"省钱",而是可控性

  1. 限流可控:一个供应商限流,其他供应商可以承接
  2. 成本可控:根据任务复杂度选择最优供应商
  3. 能力可控:不同任务使用最适合的模型
  4. 架构可控:统一接入层可以灵活调整供应商配置

如果你也在构建AI基础设施,我的建议是:不要把所有鸡蛋放在一个篮子里,尤其是在生产环境中。


更新日志:本文基于2026年5月实际架构编写,供应商和模型可能随时间变化,请以实际配置为准。