
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
当前,生成式AI如大语言模型(LLMs)在文本和图像生成方面取得了显著成就,但其是否具备真正的理解能力引发深思。生成式AI通过深度网络自监督学习生成内容,但在理解和感知行为的意义方面仍有局限。生命有机体通过与环境的互动和主动推理来理解世界,而生成式AI仅依赖数据统计规律,缺乏对因果关系的理解。主动推理强调基于感觉运动经验的预测,而生成式AI则缺乏这种互动,难以形成深层的因果结构认识。若要生成式AI具备理解能力,需转向主动选择和互动的学习方式,而非单纯依赖数据量和模型复杂度。
摘要的核心观点在于对比生成式AI与主动推理在理解世界上的差异,强调互动和感觉运动经验的重要性。
原文链接
近日,有外媒报道,OpenAI 正在调整策略应对大模型改进速度放缓的问题。知名认知科学家Gary Marcus称,GPT正进入收益递减期。不仅仅是GPT,其他大模型也面临类似困境。
OpenAI 的新模型Orion在完成20%的训练后便达到GPT-4的水平,但整体提升幅度不如从前。这意味着GPT升级...
原文链接
中科院人大百川团队提出VideoNIAH,一种新方法来测试大模型的视频理解能力。他们通过在视频中插入无关的图像或文本,创建VideoNIAH框架,生成多样化测试数据,评估模型对时间理解、细粒度理解、时空建模和长上下文处理的能力。VideoNIAH用于构建合成视频理解基准VNBench,包含1350个样本,测试了多种模型,发现专有模型如GPT-4o在特定任务上表现不佳,特别是计数和排序。VNBench的多样性设计使它能全面评估模型在不同视频长度、内容和查询条件下的性能,指出现有模型在长依赖和细粒度时空理解上还有提升空间。研究结果为视频理解技术发展提供了方向。
原文链接
加载更多

暂无内容