
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
9月26日,OpenAI发布新基准测试,评估其AI模型与行业专家的工作表现。结果显示,GPT-5-high在40.6%的任务中媲美或超越人类专家,而Anthropic的Claude Opus 4.1在49%的任务中达到类似水平。OpenAI指出,Claude得分更高部分因其擅长生成美观图表,而非单纯性能优势。这一测试凸显AI在专业领域的快速进步,引发对人机协作未来的更多讨论。
原文链接
加载更多

暂无内容