综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
1月22日,百度正式发布文心大模型5.0正式版。该模型基于原生全模态建模,拥有2.4万亿参数,支持文本、图像、音频、视频等多模态信息的理解与输出。目前,文心5.0已上线百度千帆平台,并接入文心一言官网、百度慧播星及文心助手等百度AI产品,为用户提供更强大的技术支持与服务。(记者 黄心怡)
原文链接
1月5日,智元机器人与MiniMax上海稀宇科技达成合作,共同推动全模态AI在机器人领域的落地应用。根据协议,MiniMax将为智元机器人提供文本到语音的全流程AI技术支持,并为其打造专属人设体系,优化语音交互体验。此外,MiniMax基于人设体系设计定制化提示词策略,生成个性化音色,实现千人千面的语音合成,满足多样化需求。同时,MiniMax利用自研音乐生成模型,助力智元机器人拓展娱乐场景功能。这一合作旨在提升用户交互体验,探索AI技术在机器人领域的更多可能性。(记者 黄心怡)
原文链接
2025年12月,上海大模型独角兽MiniMax通过港交所聆讯,正式启动IPO冲刺。成立仅四年,MiniMax累计融资超15亿美元,吸引米哈游、阿里巴巴等知名机构投资。招股书显示,公司以5亿美元成本实现全模态能力全球领先,仅为OpenAI支出的1%。技术上,MiniMax在文本、语音、音乐和视频领域均取得突破,其M2模型推理速度是Claude 3.5 Sonnet两倍,API价格却仅为其8%。财务方面,2024年营收达3052万美元,同比增长782.2%,2025年前9个月营收再涨175%,达5344万美元,海外收入占比超70%。尽管仍处亏损,但毛利率从2023年的-24.7%提升至2025年前9个月的23.3%。团队年轻化,平均年龄29岁,研发人员占比73.8%,高效管理与AI工具助力公司快速崛起。
原文链接
2025年12月9日,阿里Qwen团队发布全新全模态大模型Qwen3-Omni-Flash-2025-12-01。新模型在文本、图像、音视频处理上实现无缝输入与实时流式输出,大幅提升多轮对话稳定性及语音自然度,支持自适应语速与韵律调节,拟人化表现逼近真人水平。新增System Prompt自定义功能,用户可设定“甜妹”“御姐”等人设风格,调整表达偏好与回复长度。同时,模型支持119种文本语言、19种语音识别语言和10种语音合成语言,跨语言交互更精准。性能方面,逻辑推理、代码生成及视觉问答等任务均有显著提升,进一步强化复杂指令理解能力,带来更智能的多模态体验。
原文链接
11月23日,青岛虚拟智能体产业大会暨人工智能创新应用先导区第七届“百企百景”对接洽谈会召开,会上发布国内首个支持全模态实时交互的大模型VisualGPT,并启动青岛市智能体训练平台。VisualGPT突破传统AI的“对话框”限制,实现从单一“文字流”到沉浸式“视觉界面直连”的跨越。智能体训练平台将整合算力与数据资源,聚焦多领域场景,推动产业升级与智能应用落地,为人工智能技术发展注入新动力。
原文链接
11月18日,蚂蚁集团推出全模态通用AI助手“灵光”,支持30秒用自然语言生成小应用,号称业内首个全代码生成多模态内容的AI助手。上线仅两天,下载量突破50万,并在第三天冲上App Store总榜第七和免费工具榜第一。然而,11月20日,因用户量激增,“灵光”的闪应用功能崩溃,官方回应称正在紧急修复中,目前该功能尚未恢复。
原文链接
2025年11月18日,蚂蚁集团正式发布全模态通用AI助手“灵光”,可在移动端实现30秒生成小应用,支持编辑、交互和分享。灵光首批上线三大功能:“灵光对话”提供逻辑清晰的可视化内容;“灵光闪应用”最快30秒生成个性化AI应用,如“溏心蛋时间计算器”;“灵光开眼”通过AGI相机技术实时解析物理世界。灵光采用全代码生成多模态内容,支持3D、音视频、图表等输出,并构建多智能体协作架构,提升用户体验。作为蚂蚁集团AGI战略的重要探索,灵光展现了从技术突破到场景落地的全链路能力,目前已登陆安卓与苹果应用商店。
原文链接
11月18日,蚂蚁集团推出业内首个全模态通用AI助手“灵光”,支持自然语言30秒生成小应用,可输出3D模型、音频、图标、动画、地图等多模态内容。首批上线三大功能:“灵光对话”提供语音朗读、3D模型、图表生成等可视化答案;“灵光闪应用”快速生成交互式小工具;“灵光开眼”赋予手机智能探索能力,支持文生图、图生视频等创作。目前已登陆安卓平台,适用于办公、学习及生活场景,为用户提供高效便捷的AI体验。
原文链接
2025年11月,百度正式发布文心5.0,主打原生全模态技术,支持文字、图片、音频、视频的全模态输入与输出。模型参数规模超2.4万亿,采用自回归统一架构和混合专家设计,激活比例低于3%,兼顾性能与效率。文心5.0 Preview已上线网页版、App及百度千帆平台,提供API服务,目前支持全模态输入+多模态输出,全模态输出版本将陆续推出。实测显示,其在多模态理解、推理、跨模态整合等方面表现突出,如精准分析视频情感、识别谐音梗图、生成新图像等。此前,文心5.0 Preview在LMArena文本排行榜中得分1432,位居全球第二、国内第一。此次发布是百度在底层架构与算法优化上的又一次突破,探索多模态‘强推理’与‘深理解’的新边界。
原文链接
11月13日,在2025百度世界大会上,百度创始人李彦宏正式发布文心大模型5.0。该模型参数规模超2.4万亿,采用自回归统一架构和超稀疏混合专家架构,是新一代原生全模态大模型,支持理解与生成一体化。文心大模型5.0在全模态理解、创意写作、智能体规划、指令遵循等方面表现优异,尤其在语言、视觉理解、音频理解及视觉生成等测试中表现突出。百度现场演示了其在视频理解、视频生成(如《甄嬛传》片段二创)以及代码编写方面的能力,并表示模型持续学习进化中。目前,文心大模型5.0已上线百度千帆平台,用户可登录调用。
原文链接
加载更多
暂无内容