标题:14B小模型逆袭翻译赛道,论文财报实测超Claude,不信试试“我命由我不由天”
网易有道的14B子曰翻译大模型2.0在英译中和中译英方面超越Claude 3.5 Sonnet等主流模型。例如,“我命由我不由天”在子曰2.0中被译为“I’m the master of my destiny”,简洁有力。子曰2.0在专业领域如医学和学术论文翻译中表现更佳,准确且自然。
测试结果显示,子曰2.0在语料库丰富度和专业词汇处理上优于Claude 3.5 Sonnet。例如,子曰2.0正确翻译了“透明细胞肾细胞癌”,而Claude 3.7误译为“清细胞肾细胞癌”。子曰2.0还能准确翻译“Strawberry Shake-Shake”为“草莓摇摇奶昔”。
在论文和财报翻译中,子曰2.0不仅准确,还符合中文表达习惯。例如,它将“MSE”和“MMD”准确翻译为“均方误差”和“最大均值差异”,而Claude 3.5 Sonnet仅做了基本翻译。
子曰2.0采用人工清洗的数据、二次训练、蒸馏技术和在线DPO优化,显著提升了翻译质量和专业性。评估显示,子曰2.0在WMT和Flores-200数据集上的表现优异,人工评估也证明其翻译质量更高。
总之,子曰2.0展示了垂直领域小模型在翻译中的优势,特别是在专业和复杂场景下。
原文链接
本文链接:https://kx.umi6.com/article/15307.html
转载请注明文章出处
相关推荐
换一换
三家混战,大模型重回2023
2025-08-03 11:35:50
人民呼唤DeepSeek!
2025-07-16 12:02:16
字节跳动、阿里AI“大将”出走 大模型厂商中高层流动持续
2025-08-25 21:35:41
AI 语音爆发的这半年,一位“局中人”看到的赛道爆发逻辑
2025-07-03 12:21:05
我国大模型数量居全球首位
2025-07-27 13:58:52
中国企业调用大模型日均超10万亿Tokens
2025-09-01 12:17:48
马斯克Grok-4碾压所有大模型!“比所有博士聪明”,AIME25拿满分
2025-07-10 16:23:20
实测Qwen-MT翻译模型,确实又快又好
2025-08-03 15:37:59
31亿!我国大模型应用个人用户注册“爆表” 竟超全国人口规模2倍多
2025-07-31 12:06:11
「今年业务是去年5倍以上」,工业智能体掀热潮
2025-08-29 12:38:30
消费电子将被大模型重新定义?云天励飞董事长陈宁:看好推理算力需求的爆发 全面押注AI芯片
2025-07-25 11:23:59
智谱旗舰模型GLM-4.5重磅发布 相关企业有望站上风口
2025-07-29 08:27:00
DeepSeek删豆包冲上热搜,大模型世子之争演都不演了
2025-08-21 13:31:42
540 文章
255723 浏览
24小时热文
更多
-
2025-10-24 09:34:47 -
2025-10-24 09:33:43 -
2025-10-24 09:32:35