12月5日,火山引擎发布豆包语音识别模型2.0(Doubao-Seed-ASR-2.0)。新模型推理能力显著提升,上下文关键词召回率提高20%,通过深度理解上下文实现更精准的语音识别。新增多模态视觉识别功能,支持单图和多图输入,进一步提升文字识别准确性。此外,该模型支持13种海外语种,包括日语、韩语、德语和法语等,满足国际化需求。此次升级为语音识别技术带来全新突破,助力多场景应用发展。
原文链接
本文链接:https://kx.umi6.com/article/29735.html
转载请注明文章出处
相关推荐
换一换
豆包语音识别模型 2.0 上线:不仅“听懂字”还能“看懂图”,支持日韩德法等 13 种外语
2025-12-05 16:43:33
豆包语音识别模型2.0上线
2025-12-05 16:45:45
OpenAI和NextDC计划斥资46亿美元在澳大利亚悉尼建设数据中心
2025-12-05 11:28:34
OpenAI最快将于下周二发布GPT-5.2
2025-12-06 07:18:55
用 AI 合成死螃蟹视频骗退款 195 元,买家被行拘 8 日
2025-12-05 23:56:50
豆包手机助手:已下线操作银行、互联网支付类APP的能力
2025-12-06 18:44:32
2025年的冬天,上海凭什么被称为“世界具身智能第一战场”?
2025-12-05 13:27:12
工信部召开务虚会 研究谋划“十五五”及开局之年工作
2025-12-07 15:35:49
解锁产业互联网新周期,他们都说了什么
2025-12-05 14:32:26
广西“十五五”规划建议:高标准建设中国—东盟国家人工智能应用合作中心
2025-12-07 10:23:39
华为面向医疗领域发布 AI 数据平台,涵盖知识生成与检索等
2025-12-07 18:40:26
SpaceX据称拟按8000亿美元估值出售内部股份
2025-12-06 03:08:19
第二十五届中国股权投资大会圆满落幕, 领航行业向新而行
2025-12-05 16:36:34
599 文章
347174 浏览
24小时热文
更多
-
2025-12-07 20:45:46 -
2025-12-07 18:40:26 -
2025-12-07 18:39:34