
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
图灵奖得主、Meta首席AI科学家杨立昆近日在“Big Technology Podcast”节目中指出,当前大语言模型的发展已接近瓶颈,仅靠文本训练无法实现人类级智能。他强调,现有AI技术依赖于文本数据的统计规律生成答案,缺乏创造新事物的能力及对物理世界的理解与抽象推理能力。杨立昆认为,单纯扩大模型规模和增加训练数据无法突破这一局限,真正的AI应具备理解物理世界、持久记忆、推理与规划能力。他预测,AI技术将在2030年前迎来新变革,但目前仍难以支撑家用机器人和自动驾驶汽车等应用。杨立昆正研发一种新系统,通过预测物理世界行为使AI更好地理解现实。
原文链接
谷歌发布了先进的视频生成模型Veo 2,超越了Sora,能够更好地理解物理世界和运动细节,分辨率高达4K。Veo 2不仅能生成高质量的视频,还能理解电影摄影语言,如镜头类型和效果。相比Sora,Veo 2在物理建模和一致性方面表现更佳。此外,谷歌还推出了Imagen 3图像生成模型和Whisk工具,后者允许用户通过图像而非文本作为提示生成图像。这些模型和工具在细节、真实感和多样性方面都有显著提升,为内容创作者提供了新的可能性。
原文链接
【让AI更懂物理世界!人大北邮上海AI Lab等提出多模态分割新方法】
近期,来自中国人民大学高瓴GeWu-Lab、北京邮电大学及上海AI Lab的研究人员共同提出了名为Ref-AVS(视听场景下的指代分割)的新方法,旨在让AI具备多模态线索下的定位与理解能力,更深入地理解真实物理世界。这一...
原文链接
加载更多

暂无内容