1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

12月5日,火山引擎发布豆包语音识别模型2.0(Doubao-Seed-ASR-2.0),新增多模态视觉识别功能,支持“听懂字”和“看懂图”,大幅提升文字与场景识别精准度。模型优化了上下文推理能力,关键词召回率提升20%,并支持日语、韩语、德语、法语等13种外语识别。通过深度理解上下文及图像辅助,可精准判断易混淆词汇,如搜拍场景中的“滑鸡”与“滑稽”。此外,模型基于PPO强化学习方案,无需依赖历史记录即可泛化理解动态交互场景,适用于图片创作和跨语言交流。目前,该模型已上线火山方舟体验中心,并对外提供API服务。

原文链接
本文链接:https://kx.umi6.com/article/29733.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
豆包语音识别模型 2.0 上线:不仅“听懂字”还能“看懂图”,支持日韩德法等 13 种外语
2025-12-05 16:43:33
豆包语音识别模型2.0上线
2025-12-05 16:45:45
谨防诈骗!OpenClaw创始人否认入驻微博等中文社交平台
2026-03-08 14:07:08
美国国防部官员称目前未与Anthropic进行任何实质性谈判
2026-03-06 11:57:53
超智算智能算力中心揭牌暨AI算力设备点亮仪式成功举行
2026-03-06 20:29:36
高中生AI创业,现在只招龙虾员工:每月成本2800
2026-03-08 18:28:34
上海人工智能实验室推出DeepLink多元算力混合推理加速方案
2026-03-09 15:53:40
近千名爱好者在深圳腾讯大厦门口排队安装OpenClaw 今早11点预约号发放完毕
2026-03-06 17:21:47
深圳龙岗拟出台措施 支持OpenClaw&OPC发展
2026-03-08 17:26:26
网文作家遇职业危机!AI写作48小时生成500万字长篇小说
2026-03-08 15:12:48
美国拟将AI芯片出口管制扩展至全球 英伟达、AMD等公司出口需获许可
2026-03-06 06:31:53
阿里AI办事发展速度快于亚马逊及OpenAI
2026-03-07 16:46:47
软银据悉寻求最高400亿美元贷款 用于投资OpenAI
2026-03-06 13:02:04
24小时热文
更多
扫一扫体验小程序