综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
8月12日,商汤科技联合创始人林达华发表文章《迈向多模态通用智能:商汤的思考》,指出AI下一阶段突破需超越语言,回归与世界的交互。他认为,智能的核心是自主交互能力,包括感知、推理、决策等多维度,语言只是描述世界的工具,并非智能本源。大语言模型虽是通向通用人工智能(AGI)的重要一步,但AI未来需具备多模态信息感知与处理能力,像人类一样用感官接收信息并转化为可计算表征。林达华强调,多模态能力是实现AGI的必由之路。
原文链接
在2025年WAIC大会上,商汤科技发布国内首个实现“图文交错思维”的商业级大模型“日日新6.5”,并提出从多模态感知、推理到物理世界交互的完整演进路线图,直指通用人工智能(AGI)目标。商汤联合创始人林达华教授发表万字长文,剖析多模态智能的发展路径与挑战。文章指出,多模态是AI未来核心,原生多模态模型通过融合训练突破语言与视觉边界,并以“四次破壁”框架推动AI能力演进。商汤通过大规模自动化数据构造与严格质量控制解决数据稀缺问题,同时优化模型架构,提升效率超3倍。林达华强调,商汤的技术基因、高效研究组织及技术与商业的正向循环是其创新力源泉,为行业提供重要参考。
原文链接
加载更多
暂无内容