
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
7月18日,OpenAI发布ChatGPT智能体,称其为史上最强通用型AI工具。该智能体可完成多种复杂任务,如写代码、制作PPT、浏览网站、规划日程等,并支持连接Gmail、GitHub等应用。底层模型在多项基准测试中表现卓越,例如Humanity's Last Exam得分为41.6%,远超此前模型;在数据科学和电子表格任务中也创下新纪录。ChatGPT智能体即日起向Pro、Plus和Team版用户开放,Enterprise和Education版用户将于7月获得权限。尽管功能强大,但产品仍处早期阶段,生成内容格式和细节可能不够完善,未来将逐步优化升级。
原文链接
5月27日,微软研究院联合清华大学、北京大学推出奖励推理模型(RRMs),通过显式推理过程动态分配计算资源,优化复杂任务评估。传统强化学习(RL)依赖人类反馈或可验证奖励,但现有奖励模型无法有效扩展测试时资源,尤其在复杂查询中表现欠佳。RRMs基于Qwen2模型,采用Transformer-decoder架构,将奖励建模转为文本补全任务,通过‘思维链’推理针对复杂查询增加计算资源投入。测试显示,RRMs在RewardBench和PandaLM Test基准中表现优异,RRM-32B在推理类别中达98.6%准确率,优于DirectJudge模型。此外,RRMs支持多响应评估,结合ELO评分和淘汰赛机制提升效率。研究证实,模型规模扩展至32B时,更长推理时间显著提高准确性,为复杂任务提供高效解决方案。
原文链接
财联社10月23日电,亚马逊支持的AI初创公司Anthropic宣布,其AI代理Claude已实现重要里程碑,能像人类一样使用计算机完成复杂任务。此次更新针对Claude 3.5 Sonnet版本,新增了“计算机使用能力”功能,使AI能够解读屏幕信息、选择按钮、输入文本、导航网站,并通过软件及互联网实时浏览执行任务。Claude作为与OpenAI的ChatGPT和谷歌的Gemini类似的聊天机器人,此次更新标志着AI技术在实际操作层面的重大进展。此次更新不仅展示了AI在模拟人类操作计算机方面的进步,也为未来更广泛的应用场景铺平了道路。
原文链接
今日,OpenAI首席执行官山姆·奥尔特曼在社交平台X上透露,OpenAI在实现其第三技术目标方面取得显著进展,即开发能够根据人类自然语言指令执行复杂任务,并在理解不清任务时请求解释的智能体。这一目标旨在解决当前算法在完成更高级语言任务上的局限,如与人对话、理解文档内容以及遵循复杂自然语言指令。奥尔...
原文链接
OpenAI近期发布其最新AI模型系列OpenAI o1,该模型在推理能力上达到AI最强水平,旨在进行通用复杂推理任务。OpenAI CEO Sam Altman将其视为AI发展新范式的开端。新模型分为两个版本:性能强大的OpenAI o1和经济高效的OpenAI o1 mini,分别适用于不同需求...
原文链接
加载更多

暂无内容