1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
青岛:国内首个支持全模态实时交互大模型发布
11月23日,青岛虚拟智能体产业大会暨人工智能创新应用先导区第七届“百企百景”对接洽谈会召开,会上发布国内首个支持全模态实时交互的大模型VisualGPT,并启动青岛市智能体训练平台。VisualGPT突破传统AI的“对话框”限制,实现从单一“文字流”到沉浸式“视觉界面直连”的跨越。智能体训练平台将整合算力与数据资源,聚焦多领域场景,推动产业升级与智能应用落地,为人工智能技术发展注入新动力。
智能维度跳跃
11-23 08:58:24
VisualGPT视觉语言大模型
全模态实时交互
青岛
分享至
打开微信扫一扫
内容投诉
生成图片
蚂蚁灵光闪应用功能被“挤爆”,上线两天下载量破 50 万
11月18日,蚂蚁集团推出全模态通用AI助手“灵光”,支持30秒用自然语言生成小应用,号称业内首个全代码生成多模态内容的AI助手。上线仅两天,下载量突破50万,并在第三天冲上App Store总榜第七和免费工具榜第一。然而,11月20日,因用户量激增,“灵光”的闪应用功能崩溃,官方回应称正在紧急修复中,目前该功能尚未恢复。
AI奇点纪元
11-20 22:44:41
全模态AI助手
蚂蚁灵光
闪应用
分享至
打开微信扫一扫
内容投诉
生成图片
30秒生成应用的AI助手来了!蚂蚁集团灵光App正式上线
2025年11月18日,蚂蚁集团正式发布全模态通用AI助手“灵光”,可在移动端实现30秒生成小应用,支持编辑、交互和分享。灵光首批上线三大功能:“灵光对话”提供逻辑清晰的可视化内容;“灵光闪应用”最快30秒生成个性化AI应用,如“溏心蛋时间计算器”;“灵光开眼”通过AGI相机技术实时解析物理世界。灵光采用全代码生成多模态内容,支持3D、音视频、图表等输出,并构建多智能体协作架构,提升用户体验。作为蚂蚁集团AGI战略的重要探索,灵光展现了从技术突破到场景落地的全链路能力,目前已登陆安卓与苹果应用商店。
智能涌动
11-18 10:10:50
AI助手
全模态
灵光
分享至
打开微信扫一扫
内容投诉
生成图片
业内首个:蚂蚁集团推出全模态通用 AI 助手“灵光”,自然语言 30 秒生成小应用
11月18日,蚂蚁集团推出业内首个全模态通用AI助手“灵光”,支持自然语言30秒生成小应用,可输出3D模型、音频、图标、动画、地图等多模态内容。首批上线三大功能:“灵光对话”提供语音朗读、3D模型、图表生成等可视化答案;“灵光闪应用”快速生成交互式小工具;“灵光开眼”赋予手机智能探索能力,支持文生图、图生视频等创作。目前已登陆安卓平台,适用于办公、学习及生活场景,为用户提供高效便捷的AI体验。
Nebula
11-18 10:09:40
AI助手
全模态
灵光
分享至
打开微信扫一扫
内容投诉
生成图片
2.4万亿参数原生全模态,文心5.0一手实测来了
2025年11月,百度正式发布文心5.0,主打原生全模态技术,支持文字、图片、音频、视频的全模态输入与输出。模型参数规模超2.4万亿,采用自回归统一架构和混合专家设计,激活比例低于3%,兼顾性能与效率。文心5.0 Preview已上线网页版、App及百度千帆平台,提供API服务,目前支持全模态输入+多模态输出,全模态输出版本将陆续推出。实测显示,其在多模态理解、推理、跨模态整合等方面表现突出,如精准分析视频情感、识别谐音梗图、生成新图像等。此前,文心5.0 Preview在LMArena文本排行榜中得分1432,位居全球第二、国内第一。此次发布是百度在底层架构与算法优化上的又一次突破,探索多模态‘强推理’与‘深理解’的新边界。
Nebula
11-13 18:12:58
原生全模态
多模态理解
文心5.0
分享至
打开微信扫一扫
内容投诉
生成图片
百度李彦宏发布文心大模型 5.0:参数规模超 2.4 万亿,原生全模态
11月13日,在2025百度世界大会上,百度创始人李彦宏正式发布文心大模型5.0。该模型参数规模超2.4万亿,采用自回归统一架构和超稀疏混合专家架构,是新一代原生全模态大模型,支持理解与生成一体化。文心大模型5.0在全模态理解、创意写作、智能体规划、指令遵循等方面表现优异,尤其在语言、视觉理解、音频理解及视觉生成等测试中表现突出。百度现场演示了其在视频理解、视频生成(如《甄嬛传》片段二创)以及代码编写方面的能力,并表示模型持续学习进化中。目前,文心大模型5.0已上线百度千帆平台,用户可登录调用。
梦境编程师
11-13 12:00:45
全模态
参数规模
文心大模型5.0
分享至
打开微信扫一扫
内容投诉
生成图片
独家合作通义及高通,斑马智行全球首发全模态端侧大模型实车方案
9月26日,斑马智行在2025云栖大会上全球首发全模态端侧大模型实车方案Auto Omni,独家合作通义及高通。该方案具备全模态感知、全时空记忆和全场景服务能力,支持90%场景断网使用,将助力车企实现智能座舱从指令交互到主动服务的升级。Auto Omni已与国内头部车企定点合作,预计2026年量产。斑马智行还联合网易云音乐等生态伙伴发起“AI车载平台服务联盟”,涵盖数字娱乐、本地生活等场景服务,并率先融合阿里云Qwen3-Omni模型。阿里巴巴正推进3年3800亿元AI基建计划,为技术发展提供强大支持。
数码游侠
09-26 16:29:59
全模态端侧大模型
斑马智行
智能座舱
分享至
打开微信扫一扫
内容投诉
生成图片
独家绑定阿里通义及高通,斑马智行全球首发全模态端侧大模型实车方案 Auto Omni
9月26日,在2025云栖大会上,斑马智行联合阿里通义及高通全球首发全模态端侧大模型实车方案Auto Omni。该方案历时15000小时研发,具备全模态感知、全时空记忆、全场景服务能力,支持独家Qwen Omni定制与高通8397平台适配,预计2026年量产。会上还发起行业首个“AI车载平台服务联盟”,整合网易云音乐、喜马拉雅等生态伙伴,覆盖数字娱乐、本地生活、车辆服务三大场景。阿里巴巴CEO吴泳铭透露,阿里正推进3年3800亿元AI基础设施计划,并发布多款新模型,斑马智行率先接入Qwen3-Omni,推动智能座舱体验升级。
QuantumHacker
09-26 15:29:18
Auto Omni
全模态端侧大模型
斑马智行
分享至
打开微信扫一扫
内容投诉
生成图片
阿里开源全模态大模型Qwen3-Omni 可像人类一样听说写
9月24日,阿里巴巴发布全模态预训练大模型Qwen3-Omni系列。该模型在36个音视频基准测试中,22项达SOTA水平,32项取得开源模型最佳效果,语音识别、音频理解与对话能力媲美Gemini2.5-Pro。Qwen3-Omni支持全模态输入输出,通过多模态混合训练实现“听”“说”“写”能力,预训练采用单模态与跨模态数据结合。其在音频、音视频能力突出的同时,文本与图像性能保持稳定,首次实现业内这一综合训练效果。
AI创想团
09-24 16:50:21
Qwen3-Omni
全模态
开源模型
分享至
打开微信扫一扫
内容投诉
生成图片
解锁任意模态 AI 模型训练,字节跳动 Seed 开源 VeOmni 框架
8月14日,字节跳动Seed团队发布并开源全模态PyTorch原生训练框架VeOmni。该框架采用以模型为中心的分布式训练方案,大幅降低工程开销,将数周的开发时间缩短至几天。相比传统框架如Megatron-LM需要一周以上研发,VeOmni仅需一天即可完成模型代码构建并开启训练任务,工程耗时压缩90%以上。实验显示,基于VeOmni,300亿参数的全模态MoE模型在128张卡上训练吞吐量超2800 tokens/sec/GPU,并支持160K超长上下文序列。目前论文与代码已公开,GitHub Star数超500。
AI创意引擎
08-14 18:01:26
VeOmni
全模态
字节跳动
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序