2026年2月11日,蚂蚁集团开源发布了全模态大模型Ming-Flash-Omni 2.0。这是业界首个全场景音频统一生成模型,能够在同一条音轨中同时生成语音、环境音效与音乐。用户可通过自然语言指令,灵活控制音色、语速、语调、音量、情绪及方言等参数。该模型在推理阶段实现了3.1Hz的极低推理帧率,支持分钟级长音频的实时高保真生成,为音频内容创作提供了全新工具。(记者 黄心怡)
原文链接
本文链接:https://kx.umi6.com/article/32846.html
转载请注明文章出处
相关推荐
换一换
蚂蚁集团开源 Awex 框架,秒级完成 TB 级参数交换
2025-11-20 10:17:17
蚂蚁集团入股AI硬件研发商艾德未来智能
2025-10-27 10:59:45
蚂蚁发布并开源万亿参数思考模型Ring-1T,综合能力逼近GPT-5
2025-10-14 11:14:06
蚂蚁集团与华西医院达成战略合作 共同推进“AI+医疗”的融合创新
2025-11-09 15:34:38
蚂蚁集团联合清华大学发布开源强化学习训练框架AReaL v1.0稳定版
2026-03-04 11:36:51
消息称 AI 创企边塞科技被蚂蚁集团收购:公司会独立运营,投资人已退出
2024-11-21 10:30:37
全球首个 AI 智能体安全测试标准发布,蚂蚁集团、清华大学、中国电信等联合编制
2025-07-14 19:25:10
蚂蚁集团支付宝体验技术部开源智能编程助手 Neovate Code
2025-09-24 19:48:32
阿里千问全模态大模型Qwen3.5-Omni上线
2026-03-30 22:11:01
从“百模大战”到行业整合,大模型创企开始被大厂“收编”
2024-11-25 11:06:22
中国AI应用跑出全球速度,灵光4天突破100万下载
2025-11-22 15:23:19
未来智能完成亿元级A轮融资 蚂蚁集团领投、启明创投超额跟投
2025-10-13 16:02:23
蚂蚁集团通用 AI 助手灵光上线网页版,可“30 秒用自然语言生成小应用”
2025-12-09 11:28:27
683 文章
525975 浏览
24小时热文
更多
-
2026-03-30 23:11:28 -
2026-03-30 23:10:19 -
2026-03-30 22:11:01