12月5日,火山引擎发布豆包语音识别模型2.0(Doubao-Seed-ASR-2.0)。新模型推理能力显著提升,上下文关键词召回率提高20%,通过深度理解上下文实现更精准的语音识别。新增多模态视觉识别功能,支持单图和多图输入,进一步提升文字识别准确性。此外,该模型支持13种海外语种,包括日语、韩语、德语和法语等,满足国际化需求。此次升级为语音识别技术带来全新突破,助力多场景应用发展。
原文链接
本文链接:https://kx.umi6.com/article/29735.html
转载请注明文章出处
相关推荐
换一换
豆包语音识别模型2.0上线
2025-12-05 16:45:45
豆包语音识别模型 2.0 上线:不仅“听懂字”还能“看懂图”,支持日韩德法等 13 种外语
2025-12-05 16:43:33
马斯克下场抢人!xAI组建「人才狙击队」,极客版HR年薪168万
2026-01-22 12:51:47
白宫加密与AI顾问 :美国传统银行与加密行业最终将融合为数字资产行业
2026-01-22 16:00:45
欧盟提出《数字网络法案》拟统一网络连接规则
2026-01-21 19:24:13
头号重仓股易主 公募持续掘金AI主线
2026-01-23 06:34:26
石油巨头沙特阿美借 AI 降本增效,2025 年技术应用价值预计达 30-50 亿美元
2026-01-21 16:19:39
OpenAI已建立人形机器人实验室 启动以来规模扩大四倍多
2026-01-22 21:11:56
卢宗青团队新作:人类先验打底,统一动作对齐,通用机器人模型正在落地
2026-01-22 17:03:53
广东:支持各地市稳妥有序开放自动驾驶多场景道路测试应用 扩大高级别自动驾驶应用区域
2026-01-21 17:22:28
全球算力产业,正在陪着OpenAI走钢丝
2026-01-22 13:55:20
2026年将成消费电子「最贵之年」?
2026-01-22 00:31:16
文心 App 要做社交了?百度内部人士:没有考虑取代微信
2026-01-21 16:18:23
641 文章
416164 浏览
24小时热文
更多
-
2026-01-23 12:56:24 -
2026-01-23 11:53:08 -
2026-01-23 11:52:03