综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
刘壮陈丹琦新作:开源通用视觉推理RL框架,0思考数据刷新SOTA
量子位 | 公众号 QbitAI
普林斯顿刘壮团队联合陈丹琦推出了一款开源强化学习(RL)框架——Vero,专攻通用视觉推理任务。这一框架能够胜任图表、科学、空间理解等多类开放视觉任务,并在30多项测试中达到8B参数规模视觉语言模...
原文链接
加载更多
暂无内容