1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0
2026年2月11日,蚂蚁集团开源发布了全模态大模型Ming-Flash-Omni 2.0。这是业界首个全场景音频统一生成模型,能够在同一条音轨中同时生成语音、环境音效与音乐。用户可通过自然语言指令,灵活控制音色、语速、语调、音量、情绪及方言等参数。该模型在推理阶段实现了3.1Hz的极低推理帧率,支持分钟级长音频的实时高保真生成,为音频内容创作提供了全新工具。(记者 黄心怡)
跨界思维
02-11 12:21:23
Ming-Flash-Omni 2.0
全模态大模型
蚂蚁集团
分享至
打开微信扫一扫
内容投诉
生成图片
阿里发布 Qwen3-Omni-Flash 全模态大模型,甜妹、御姐等 AI 人设风格任你选
2025年12月9日,阿里Qwen团队发布全新全模态大模型Qwen3-Omni-Flash-2025-12-01。新模型在文本、图像、音视频处理上实现无缝输入与实时流式输出,大幅提升多轮对话稳定性及语音自然度,支持自适应语速与韵律调节,拟人化表现逼近真人水平。新增System Prompt自定义功能,用户可设定“甜妹”“御姐”等人设风格,调整表达偏好与回复长度。同时,模型支持119种文本语言、19种语音识别语言和10种语音合成语言,跨语言交互更精准。性能方面,逻辑推理、代码生成及视觉问答等任务均有显著提升,进一步强化复杂指令理解能力,带来更智能的多模态体验。
小阳哥
12-11 09:38:42
全模态大模型
多语言能力
甜妹御姐人设
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序