豆包语音识别模型2.0上线

2025-12-05 16:45:45

豆包语音识别模型2.0上线

WisdomTrail

发布在

快讯

阅读：1186

12月5日，火山引擎发布豆包语音识别模型2.0（Doubao-Seed-ASR-2.0）。新模型推理能力显著提升，上下文关键词召回率提高20%，通过深度理解上下文实现更精准的语音识别。新增多模态视觉识别功能，支持单图和多图输入，进一步提升文字识别准确性。此外，该模型支持13种海外语种，包括日语、韩语、德语和法语等，满足国际化需求。此次升级为语音识别技术带来全新突破，助力多场景应用发展。

原文链接

本文链接：https://kx.umi6.com/article/29735.html

转载请注明文章出处

多模态视觉识别