9月25日,三星发布自研AI性能基准测试工具TRUEBench(可信真实场景使用评估基准)。该工具由三星研究院开发,旨在解决现有AI基准测试工具的不足,如仅关注英语和单轮问答结构等问题。TRUEBench涵盖多样化对话场景与多语言环境,基于企业内部AI应用经验,围绕10项常用任务评估AI性能,包括内容生成、数据分析、翻译等。其测试集包含2485组数据,覆盖10大类、46子类及12种语言,任务长度从8字符到20000字符不等。评分体系由AI与人类协作设计,并已在开源平台Hugging Face上线。三星DX部门CTO兼三星研究院院长表示,TRUEBench将确立生产力领域评估标准,巩固三星技术领先地位。
原文链接
本文链接:https://kx.umi6.com/article/25876.html
转载请注明文章出处
相关推荐
换一换
三星的内忧外患
2024-07-15 23:21:56
消息称 OpenAI 阿尔特曼和三星李在镕首次单独会面,讨论合作 AI 芯片
2024-06-12 11:17:53
三星 19 年蝉联全球电视销冠:24Q1 销售额占比为 29.3%、销量占比 18.7%
2024-05-23 15:34:58
消息称英伟达、三星联手投资 AI 机器人公司 Skild AI,估值达 45 亿美元
2025-06-12 13:34:33
AI芯片竞争的关键时刻,三星爆发史上最大规模罢工
2024-07-12 19:06:19
三星将推出首款AI冰箱:搭载谷歌Gemini 可识别食材、推荐菜谱
2025-12-21 17:56:21
三星推出一站式 AI 整合频道:人工智能技术让本世纪初老剧集重焕光彩
2025-12-26 12:35:53
四足机器人入驻三星研究机构
2025-02-06 11:36:11
三星版“豆包手机”发布 深度绑定AI
2026-02-27 18:03:30
三星宣布将 Bixby 语音助手引入 BESPOKE AI 家电,语音控制更智能
2024-08-26 15:44:11
全球手机销量出炉,谁能翻过苹果的大山?
2025-02-13 15:05:32
三星折叠屏新机现场上手:更轻更薄了,AI是杀手锏
2024-07-18 08:41:16
三星人工智能折叠机预计7月10日亮相
2024-07-07 10:29:45
686 文章
493226 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18