9月25日,三星发布自研AI性能基准测试工具TRUEBench(可信真实场景使用评估基准)。该工具由三星研究院开发,旨在解决现有AI基准测试工具的不足,如仅关注英语和单轮问答结构等问题。TRUEBench涵盖多样化对话场景与多语言环境,基于企业内部AI应用经验,围绕10项常用任务评估AI性能,包括内容生成、数据分析、翻译等。其测试集包含2485组数据,覆盖10大类、46子类及12种语言,任务长度从8字符到20000字符不等。评分体系由AI与人类协作设计,并已在开源平台Hugging Face上线。三星DX部门CTO兼三星研究院院长表示,TRUEBench将确立生产力领域评估标准,巩固三星技术领先地位。
原文链接
本文链接:https://kx.umi6.com/article/25876.html
转载请注明文章出处
相关推荐
换一换
三星将为英伟达AI工作站供应SSD
2025-10-28 08:39:45
三星 2024 年新品电视首发全量接入讯飞星火影视顾问智能体
2024-07-18 20:08:30
三星进军 AI 机器人领域,Ballie 本周公开亮相
2025-04-09 09:39:59
韩国的国家级风险:三星怎么在AI时代掉队了?
2025-08-17 19:39:18
英伟达被三星狂挖墙脚
2024-06-20 22:07:28
四足机器人入驻三星研究机构
2025-02-06 11:36:11
三星:今年将大幅提升Galaxy AI产品数量
2025-07-10 14:29:11
三星奋起直追:据传已成立“北美AI中心”,请来苹果前Siri高管!
2024-06-12 09:01:45
三星重金对抗SK海力士和台积电
2024-08-16 12:05:19
不止于 HBM 内存供应,三星、SK 均与 OpenAI 达成多角度 AI 战略合作伙伴关系
2025-10-02 10:07:51
三星CES展力推AI家电 计划大力加强AI投资
2025-01-07 11:02:15
三星宣布提供AI电视操作系统免费升级服务
2024-08-23 15:34:42
三星布局未来:任命新首席财务官、成立新 AI 中心
2024-12-05 07:54:04
602 文章
362039 浏览
24小时热文
更多
-
2025-12-08 17:39:25 -
2025-12-08 17:37:43 -
2025-12-08 16:38:29