9月24日,阿里巴巴发布全模态预训练大模型Qwen3-Omni系列。该模型在36个音视频基准测试中,22项达SOTA水平,32项取得开源模型最佳效果,语音识别、音频理解与对话能力媲美Gemini2.5-Pro。Qwen3-Omni支持全模态输入输出,通过多模态混合训练实现“听”“说”“写”能力,预训练采用单模态与跨模态数据结合。其在音频、音视频能力突出的同时,文本与图像性能保持稳定,首次实现业内这一综合训练效果。
原文链接
本文链接:https://kx.umi6.com/article/25792.html
转载请注明文章出处
相关推荐
换一换
阿里达摩院首次开源具身智能“三大件”机器人上下文协议
2025-08-11 13:01:00
OpenAI进入新品发布周期 开源模型GPT-OSS打头阵
2025-08-06 08:26:35
科研AI出了个狠角色:开源30B小模型,硬刚Gemini和Claude
2026-03-09 12:34:15
杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOTA
2025-07-12 13:50:53
开源“裸考”真实世界,国产具身智能基座模型拿下全球第二!
2026-01-08 19:25:43
开源新标杆!商汤 SenseNova-MARS超 Gemini-3-Pro,模型代码数据全开放
2026-01-30 11:22:29
开源模型再突破,全球AI行业的拐点要来了?
2026-02-03 02:11:28
HuggingChat Omni 集成式 AI 平台发布,可针对用户指令从百款开源模型库中挑选最适合回答
2025-10-18 10:30:57
刚刚,OpenAI发布2款开源模型,手机笔记本也能跑,北大校友扛大旗
2025-08-06 07:23:51
百元级硬件流畅运行百亿参数大模型!上交&本智激活开源端侧原生大模型
2025-07-27 18:00:02
开源模型TOP5,被中国厂商包圆了
2025-10-15 17:36:49
百度李彦宏发布文心大模型 5.0:参数规模超 2.4 万亿,原生全模态
2025-11-13 12:00:45
爆火全网FLUX.2重磅上线,开源版Nano Banana来了!
2025-11-26 17:55:27
690 文章
483095 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18