1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:7B模型搞定AI视频通话,阿里最新开源炸场,看听说写全模态打通,开发者企业免费商用

深夜重磅!阿里发布并开源首个端到端全模态大模型——通义千问Qwen2.5-Omni-7B。仅需一个一体化模型,就能处理文本、音频、图像、视频全模态,并实时生成文本和自然语音。该模型被称为7B模型的全能冠军。

打开Qwen Chat即可与它实时视频或语音交互。在大街上,它能识别环境并按需推荐餐馆;走进厨房,它能指导烹饪。在多模态任务OmniBench评测中,Qwen2.5-Omni刷新记录,拿下新SOTA,优于谷歌Gemini-1.5-Pro等模型。它还能胜任数学教学、论文讲解、艺术指导等任务。

模型轻量,手机等终端可轻松部署,且开源采用宽松的Apache2.0协议,开发者和企业可免费商用。网友认为这是真正的OpenAI。模型已在Qwen Chat上支持AI语音和视频通话功能。

Qwen2.5-Omni采用Thinker-Talker双核架构,Thinker负责信息处理,Talker负责语音合成。团队还提出TMRoPE算法和位置嵌入技术,使模型能在多模态任务中表现优异。相比传统模型,Qwen2.5-Omni原生支持多模态输入和输出,效率更高。

与苹果合作后,Qwen将为国行iPhone提供AI功能,同时吸引了OPPO、vivo、荣耀等超90%国产手机品牌接入。阿里通义千问已开源200多款模型,涵盖全模态领域,生态繁荣。未来,团队将提升语音指令遵循能力和音视频协同理解能力,拓展多模态边界。

访问链接:
Qwen Chat:https://chat.qwenlm.ai
Hugging Face:https://huggingface.co/Qwen/Qwen2.5-Omni-7B
ModelScope:https://modelscope.cn/models/Qwen/Qwen2.5-Omni-7B
DashScope:https://help.aliyun.com/zh/model-studio/user-guide/qwen-omni
GitHub:https://github.com/QwenLM/Qwen2.5-Omni
Demo体验:https://modelscope.cn/studios/Qwen/Qwen2.5-Omni-Demo

原文链接
本文链接:https://kx.umi6.com/article/16250.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
蚂蚁开源业内首个 100B 扩散语言模型 LLaDA2.0
2025-12-12 15:57:42
Grok 4宣布全球免费使用
2025-08-11 11:04:47
商汤开源空间智能大模型SenseNova-SI
2025-11-11 08:59:30
Databricks 呼吁美国 AI 行业拥抱开源:这是中国能够领先的关键因素
2025-11-15 15:55:27
大厂AI各走「开源」路
2025-10-17 09:09:57
阶跃星辰新一代基础大模型 Step 3 正式开源:拥有强大视觉感知和复杂推理能力
2025-08-01 09:07:26
美团发布并开源 LongCat-Flash-Omni 模型:支持实时音视频交互,达到 SOTA 水平
2025-11-03 11:17:00
用编程大模型登顶开源第一后,智谱GLM团队被拷问了3小时
2025-12-25 11:29:48
全球首个深度推理+多模态大模型“紫东太初”4.0发布
2025-09-19 13:13:31
开源版Genie3世界模型来了:实时+长时间交互,单卡可跑,国内公司出品
2025-08-19 10:59:13
连续发布两款万亿参数模型,蚂蚁 AI 来势汹汹
2025-10-11 16:31:47
GPT-5信息大量泄露,四个版本全曝光,免费用户也能用,还有一个神秘功能
2025-08-07 18:55:45
美国《连线》杂志:再见,GPT5;你好,千问!
2025-12-29 15:27:00
24小时热文
更多
扫一扫体验小程序