2月11日,蚂蚁集团发布开源全模态大模型Ming-Flash-Omni 2.0,在视觉语言理解、语音生成、图像编辑等领域表现突出,部分指标超越Gemini 2.5 Pro,成为开源性能新标杆。该模型支持语音、音效、音乐同轨生成,并可通过自然语言精细控制音频参数,实现分钟级长音频实时生成。基于Ling-2.0架构训练,其在复杂对象识别、动态场景编辑等方面显著优化,具备零样本音色克隆与定制能力。团队表示,全模态技术通过统一架构提升多模态能力融合效率,未来将优化视频理解与长音频生成等方向。目前,模型权重与代码已在Hugging Face等平台开源,用户也可通过Ling Studio在线体验调用。
原文链接
本文链接:https://kx.umi6.com/article/32956.html
转载请注明文章出处
相关推荐
换一换
马云现身,蚂蚁换帅
2024-12-10 13:54:18
蚂蚁集团披露AI普惠进展:三大AI管家已服务超1.3亿用户 43%来自三线及以下城市
2025-06-30 11:44:08
蚂蚁发布AI健康应用AQ 打通华为、vivo、鱼跃等智能硬件
2025-06-26 15:00:09
蚂蚁集团CEO韩歆毅:在医疗健康领域 专业AI做到极致会更强
2025-09-11 17:05:26
蚂蚁健康战略再落一子:联合华西医院 探索AI医疗科研创新
2025-11-09 11:27:01
蚂蚁技术研究院副院长吕乐当选美国医学与生物工程院(AIMBE)Fellow
2026-04-21 15:10:32
消息称 AI 创企边塞科技被蚂蚁集团收购:公司会独立运营,投资人已退出
2024-11-21 10:30:37
马云现身蚂蚁20周年现场:我是为了蚂蚁未来20年而来 感谢批评让蚂蚁走得更远
2024-12-09 10:21:38
蚂蚁加码AGI 推出全模态通用AI助手“灵光”
2025-11-18 10:11:58
蚂蚁集团全力拥抱AI:大模型训练降本、一体机发布、智能眼镜招兵买马
2025-03-24 19:14:50
阿里千问全模态大模型Qwen3.5-Omni上线
2026-03-30 22:11:01
蚂蚁集团推“Plan A”人才专项,招募全球顶尖 AI 人才
2025-04-25 16:18:42
蚂蚁进军AI企业服务市场!成立“数字蚂力”新公司,发力AI to B
2024-08-15 22:46:32
736 文章
636229 浏览
24小时热文
更多
-
2026-06-08 21:46:02 -
2026-06-08 19:42:13 -
2026-06-08 19:40:56