国产AI路由系统开源逆袭!仅用19%成本达到Gemini-2.5-Pro同等性能
顶级大模型性能虽强,但高昂的成本让许多用户望而却步。为解决这一问题,上海人工智能实验室推出开源的Avengers-Pro多模型调度路由方案。该方案集成了8个行业领先的大模型,在多个挑战性数据集上表现出色。
亮点如下:
1. 性能新高:Avengers-Pro性能比GPT-5-medium高7%,比Gemini-2.5-Pro高19%。
2. 极致性价比:以仅27%的成本达到GPT-5-medium同等性能,或以19%的成本匹配Gemini-2.5-Pro性能。
3. 帕累托最优:在任意成本下实现最高准确率,或在指定准确率下将成本降至最低。
核心机制
Avengers-Pro通过嵌入(embedding)、聚类(clustering)和评分(scoring)分析用户请求,动态分配最适合的模型处理任务。具体流程包括:
1. 将用户请求转换为高维向量捕捉语义信息;
2. 聚类相似任务,识别共性需求;
3. 根据性能-成本权衡参数α评估模型综合评分,动态选择最优模型。
实验表现
Avengers-Pro整合了来自OpenAI、Anthropic、Google和阿里的8个顶尖模型,并在6个复杂数据集上测试,涵盖代码生成、科学推理等场景。结果显示:
- 在追求性能时,其平均正确率达0.66,超越最强单模型GPT-5-medium 7%;
- 与GPT-5-medium性能持平的情况下,节省27%成本;若仅需90%性能,成本可降至37%;
- 达到Gemini-2.5-Pro性能水平时,成本仅需19%。
此外,Avengers-Pro可根据不同任务灵活调整模型选择。例如,低成本时优先选择阿里Qwen系列,高性能时则倾向于GPT-5-medium。这种智能调度不仅提升了整体性能,还显著降低了成本。
论文地址:https://arxiv.org/abs/2508.12631
GitHub地址:https://github.com/ZhangYiqun018/AvengersPro
— 完 —
.png)

-
2025-08-23 08:59:22
-
2025-08-23 08:59:00
-
2025-08-23 08:58:15