
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年10月20日,美团LongCat团队发布智能体评测基准VitaBench,号称高度贴近真实生活场景。该基准聚焦外卖点餐、餐厅就餐和旅游出行三大高频场景,构建了包含66个工具的交互式评测环境,并设计跨场景综合任务。例如,在旅游规划中,要求智能体完成从购票到订餐的全过程。团队首次从深度推理、工具使用与用户交互三个维度量化复杂问题,发现领先模型在复杂跨场景任务中的成功率仅30%,揭示现有智能体与实际需求的差距。VitaBench已全面开源,为智能体研发提供基础设施,项目主页、论文、代码及数据集均已公开。
原文链接
2025年10月20日,OpenAI联合创始人Andrej Karpathy在播客与社交媒体上表示,尽管AI智能体备受关注,但其真正发挥作用还需约十年。他批评当前AI智能体智力不足、多模态能力有限、缺乏持续学习能力,且过度开发工具超越了现有能力。Karpathy担忧完全自主的AI将使人类变得无用,并导致低质量内容泛滥。他呼吁人与AI协作编写代码和执行任务,而非追求完全自动化。ScaleAI增长主管Quintin Au此前也指出,AI完成多步任务时出错率较高,可靠性仍需提升。
原文链接
标题:AI变革将是未来十年的周期
昨天听了特斯拉前自动驾驶负责人Karpathy的播客,他是OpenAI创始团队成员之一,也是最接近“AI思维核心”的人之一。他提到两点关键内容:AI变革将是未来十年的周期;我们在造幽灵。
他说,这像两把钥匙,一把打开“时间”,一把打开“智能的本质”。AI的变...
原文链接
2025年10月,全球奢侈科技品牌BUTTONS发布首款搭载特斯联通用智能体HALI的“BUTTONS SOLEMATE智能体超级影音机器人”。HALI从2024年11月首次亮相后持续优化,已进化为具备空间认知与物理交互能力的“生活协同者”,率先应用于物理世界。通过特斯联AIoT智算中心的异构算力支持,HALI实现复杂任务秒级响应,突破数字世界壁垒,获得感知、推理、行动闭环能力。其空间智能可理解三维环境几何结构与动态变化,并主动提供情境感知服务,实现“服务找人”的交互革新。此外,HALI构建三维语义记忆模型,关联物理环境进行高级规划,展现自主决策能力,标志着AI向通用智能迈进的关键一步。
原文链接
10月20日,OpenAI联合创始人Andrej Karpathy对AI智能体发展提出冷静看法,认为其真正实现‘功能完善’还需约10年。他指出,当前AI智能体存在智能不足、多模态能力欠缺、无法持续学习等问题,距离自主完成复杂任务仍有较大差距。Karpathy批评行业过于追求工具开发速度,而忽视了AI实际能力的提升,并警告完全取代人类的智能体可能导致低质量内容泛滥。他强调,理想的AI应与人类协作编程,而非单向生成代码。尽管被部分人视为‘悲观主义者’,Karpathy表示自己的观点相比彻底否定AI的人仍属乐观。
原文链接
2025年10月16日,Manus发布全新版本Manus 1.5,任务执行速度提升近四倍,平均完成时间从15分钟缩短至不足4分钟。新版本提供两种模型:Manus-1.5适用于高复杂度任务,Manus-1.5-Lite优化成本效率。其智能性能显著增强,任务质量提升15%,用户满意度提高6%。核心亮点是全栈Web应用开发功能,支持从开发到部署的完整流程,包括后端搭建、数据库集成及AI功能嵌入。新增协作与资料库功能,方便团队共享和资源管理。此外,内置浏览器可自动测试并修复生成的应用问题。
原文链接
10月15日,百度搜索宣布升级文心助手AIGC创作能力,新增支持AI图片、视频、音乐、播客等8种模态创作,并可一键调用多工具解决多场景问题。目前,百度搜索用户日均生成AIGC内容已突破千万。同时,百度发布行业首个开放式实时互动数字人智能体,进一步拓展AI技术应用场景,体现其在人工智能领域的持续创新能力。
原文链接
标题:上海AI Lab推出科研智能体FlowSearch,让AI成为科研探索伙伴
正文:
上海人工智能实验室发布了一款名为FlowSearch的科研智能体,将复杂科研过程自动化变为现实。在GAIA、HLE、GPQA和TRQA等权威科研基准上,FlowSearch性能全面领先,展示了AI在复杂科研...
原文链接
10月13日,据央视财经报道,国务院于8月印发《关于深入实施“人工智能+”行动的意见》,提出推动AI与经济社会各领域深度融合。目标是到2030年,我国新一代智能终端、智能体等应用普及率超90%。业界正加速推进智能体落地,通信运营商等各方将其视为继大模型后的重点方向,积极拓展应用场景,助力实现普及目标。
原文链接
吴恩达推出新课,聚焦Agentic AI,教授如何搭建高效的Agent工作流。课程强调四大核心设计模式:反思、工具、规划与协作,并指出系统化评估与误差分析是智能体开发的关键能力。通过Agentic技巧,甚至可以让GPT-3.5在编程任务中超越GPT-4。
Agentic AI的核心理念是将复杂任务拆...
原文链接
加载更多

暂无内容