综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
标题:腾讯胡文博:引领 3D 视频世界模型新趋势丨GAIR 2025
2025年12月12-13日,第八届GAIR全球人工智能与机器人大会将在深圳举办。大会聚焦大模型、算力变革及世界模型等议题,描绘AI前沿探索的未来图景。腾讯ARC实验室高级研究员胡文博将于12月13日发表《迈向三维感知的视频世...
原文链接
商汤分拆的AI医疗公司半年内融资10亿元,目标构建“医疗世界模型”,推动未来智慧医院发展。公司以自研医疗大语言模型“大医®”为核心,结合多模态基础模型群,覆盖病理、影像等医疗场景,并推出智慧医院综合解决方案。目前已上线40余款AI模块,与瑞金医院、罗氏制药等合作落地多项成果。团队规模约100人,研发占比超70%。CEO张少霆强调,其技术优势在于基座模型的泛化能力及细分领域的深度应用。公司还获得新加坡首张AI医疗相关认证,并在东南亚等地拓展市场。商汤正深化“1+X”战略,聚焦生成式AI与视觉AI,布局智能驾驶、智慧医疗等创新赛道。
原文链接
2025年12月,国产世界模型公司极佳视界发布并开源具身世界模型GigaWorld-0,首次实现90%训练数据由世界模型生成,使VLA模型性能提升近300%。该模型在新纹理、新视角和新物体位置三大泛化维度表现突出,突破了高质量机器人交互数据稀缺的瓶颈。GigaWorld-0由GigaWorld-0-Video和GigaWorld-0-3D两大组件构成,分别优化视觉保真度与物理准确性,并采用稀疏注意力机制和MoE架构提升效率。此外,极佳视界推出高效训练框架GigaTrain,支持FP8精度端到端训练,显著降低计算成本。实验表明,GigaWorld-0生成数据大幅提升下游任务成功率。项目已开源,链接见附。
原文链接
12月13日,雷峰网GAIR 2025将在深圳南山举办「走向真实智能的起点」专题论坛。聚焦世界模型与智能体未来发展,探讨真实世界建模能力跃迁及智能体体系结构演化两大方向。论坛邀请王靖博、胡文博等青年科学家,分享在统一模型结构、具身智能策略学习等领域的前沿研究。现场将设Demo展示环节,呈现模型突破与智能体行为策略。此外,论坛还将推出嘉宾深度访谈,记录科研思想与开源价值探索。活动旨在推动AI边界重塑,迈向真实智能未来。
原文链接
11月22日,谷歌DeepMind发布Gemini 3 Pro和Nano Banana Pro两大AI模型,引发全球关注。DeepMind CEO哈萨比斯表示,世界模型是实现通用人工智能(AGI)的关键,并预测其将迎来‘ChatGPT时刻’。谷歌Genie 3作为世界模型代表作,可基于一句话生成交互式3D环境,为机器人和自动驾驶提供训练场景。与此同时,Meta首席AI科学家杨立昆计划离职创立世界模型公司,李飞飞团队推出多模态产品Marble,英伟达也布局相关平台Cosmos。尽管世界模型尚无现象级消费产品,但其让AI从‘读懂’转向‘看懂’世界的潜力备受期待。技术仍处初期,需更多时间验证其前景。
原文链接
11月20日,谷歌DeepMind CEO哈萨比斯在Gemini 3 Pro发布后接受采访时指出,该模型是其实现通用人工智能(AGI)的关键一步,具备更强的推理能力和定制化交互功能。目前,Gemini月活跃用户达6.5亿,通过搜索功能接触用户更达20亿,谷歌还向全美高校学生提供一年免费高级版使用权。然而,哈萨比斯的研究重心已转向世界模型,称其为未来AGI核心,但面临高成本和技术难题。他承认AI私募市场存在泡沫,但强调谷歌凭借长期战略和商业化能力处于优势地位。他认为真正AGI实现还需5至10年,并警示新型技术风险需审慎应对。
原文链接
2025年11月20日,Meta首席AI科学家杨立昆宣布将于年底离职,创立一家专注于“世界模型”技术的初创公司,旨在突破当前AI对物理世界理解的局限。杨立昆表示,新公司将与Meta保持合作关系,目标是推动具备持久记忆、推理能力的高级机器智能(AMI)研究。现年65岁的杨立昆于2013年加入Meta,创建FAIR实验室,但近期因Meta AI部门重组及战略分歧决定离开。Meta正大力投资大型语言模型(LLM),而杨立昆认为需新型计算架构实现通用人工智能(AGI)。此外,Meta近期引入新人才并裁撤部分FAIR团队成员,进一步促使杨立昆选择独立发展。
原文链接
2025年初,AI领域迎来物理AI风向,光轮智能作为仿真合成数据领域的隐形冠军浮出水面。该公司刚刚完成数亿元A轮及A+轮融资,投资方包括东方富海、九派资本等机构及三七互娱、琥珀资本等产业方,老股东辰韬资本持续加注。光轮智能专注于为具身智能和世界模型提供高质量仿真合成数据,客户涵盖英伟达、谷歌、阿里、字节、丰田、博世等行业巨头,其营收已突破亿元大关。创始人谢晨曾是英伟达、Cruise及蔚来的仿真负责人,并因与黄仁勋女儿Madison Huang的对谈引发关注。随着AI训练进入‘数据决定性能’阶段,光轮智能凭借全流程数据服务能力,成为行业生态中不可或缺的一环。此轮融资将用于扩大供给能力,强化规模化交付,进一步巩固其在物理AI数据基础设施领域的领先地位。
原文链接
标题:李飞飞最新思考:语言模型救不了机器人
正文:
AI 行业近年来发展迅猛,技术迭代与讨论热度持续攀升。然而,在这密集的技术周期中,很少有人停下来思考一个基本问题:我们到底在追求怎样的智能?语言之上,是否还有尚未被充分理解的能力?
李飞飞近期发表了一篇关于世界模型的文章,重新引发了对这一问...
原文链接
2025年11月,AI领域掀起世界模型技术路线之争。李飞飞团队推出首款商用世界模型Marble,主打3D环境生成与编辑,适合游戏和VR开发,但被质疑更偏向3D渲染工具,缺乏物理规律支持。同期,LeCun离职Meta,计划创立基于JEPA框架的世界模型公司,专注于机器人决策与因果结构理解,强调抽象认知而非视觉渲染。此外,谷歌DeepMind发布的Genie 3则聚焦动态视频生成,解决了长时一致性问题,但仍以视频逻辑为核心。三种技术路线分别代表世界模型的三大范式:Marble注重可视化界面,Genie 3模拟交互环境,JEPA探索抽象认知框架。专家认为,这些模型可视为‘世界模型金字塔’,从下至上逐步抽象,越高层越贴近AI思维与机器人训练需求。
原文链接
加载更多
暂无内容