9月23日,阿里云发布并开源全球首个端到端全模态AI模型Qwen3-Omni,支持文本、图像、音频和视频的统一处理。该模型在36项音视频基准测试中,22项达最新水平,支持119种文本语言及多语言语音输入输出,创新采用MoE架构与AuT预训练技术。同时推出Qwen3-TTS文本转语音工具,支持17种音色和10种语言,并优化延迟与音质表现。此外,Qwen-Image-Edit-2509升级版提升图像编辑一致性,新增多图像编辑功能。相关模型已在GitHub、Hugging Face等平台开源。
原文链接
本文链接:https://kx.umi6.com/article/25677.html
转载请注明文章出处
相关推荐
.png)
换一换
小红书首个多模态 AI 大模型 dots.vlm1 发布并开源,基于 DeepSeek V3 LLM
2025-08-06 19:35:57
什么是真正好用的推理模型?阶跃Step 3:开源的,多模态的,低成本的,国产芯片适配的
2025-07-28 10:09:36
字节 Seed 开源统一多模态理解和生成模型 BAGEL
2025-06-03 19:01:17
刚刚,马斯克开源Grok 2.5:中国公司才是xAI最大对手
2025-08-24 10:10:55
4位图灵奖得主布道,2大冠军机器人登台,“AI春晚”果然又高又硬
2025-06-06 22:39:37
通义千问最新AI编程大模型Qwen3-Coder正式开源
2025-07-23 07:45:34
Hugging Face 桌面机器人 Reachy Mini 开订:长相呆萌,支持超 170 万个 AI 模型
2025-07-09 16:06:14
英伟达开源9B参数小模型,比Qwen3快6倍
2025-08-19 16:03:42
当FPGA遇上开源,要变天了
2025-04-27 15:25:40
MiniMax 推出全球首个开源大规模混合架构的推理模型 M1:456B 参数,性能超 DeepSeek-R1
2025-06-17 17:28:14
性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源
2025-07-26 00:31:49
昆仑万维发布并开源Matrix-Game 2.0模型
2025-08-12 10:17:03
昆仑万维宣布开源 Matrix-Game 大模型:工业界首个开源的 10B+ 空间智能大模型,支持《我的世界》
2025-05-13 10:47:25
505 文章
209450 浏览
24小时热文
更多

-
2025-09-23 14:16:47
-
2025-09-23 13:17:38
-
2025-09-23 13:16:33