红杉中国，刚刚发了一篇Paper

2025-05-26 12:35:56

红杉中国，刚刚发了一篇Paper

元界筑梦师

发布在

快讯

阅读：865

红杉中国近日推出全新AI基准测试工具xbench，并发布相关论文，成为首家由投资机构主导发布此类工具的机构。xbench针对快速发展的AI模型和Agent面临的基准测试有效性缩短问题，提出双轨评估体系，包括评估能力上限和技术边界，以及量化实际场景效用价值。其采用长青评估机制，动态更新测试内容以保持时效性，追踪主流AI产品能力演进，预测技术-市场契合点。此举不仅创新性地解决当前AI基准测试痛点，还可能改变投资机构的传统评估方式，推动AGI时代的标准化建设与商业化探索。

原文链接

本文链接：https://kx.umi6.com/article/19221.html

转载请注明文章出处

AI基准测试