
文章
(453)
7月18日凌晨,OpenAI发布ChatGPT Agent,这是继1月operator和2月deep research后在Agent化领域的又一重要进展。AI Agent领域现分化为两大流派:以OpenAI、Claude为代表的“基座派”,以及注重应用场景的“应用派”。3月Manus引发通用Agent热潮后,Genspark、Flowith等新锐玩家纷纷加入竞争。ChatGPT Agent发布后,Genspark和Manus公开质疑其能力,并通过对比案例展开较量。我们测试了多个AI Agent在婚礼规划与贴纸设计任务中的表现,结果显示各产品在任务执行中存在明显差异:部分如Manus能完成购物车添加,而其他多停留在信息搜集或指引阶段。尽管当前AI Agent仍处“混沌期”,但新玩家的加入和激烈竞争将推动更成熟解决方案的诞生,为复杂任务处理带来新可能。
原文链接
7月16日,英伟达创始人黄仁勋在北京链博会演讲时身穿唐装亮相,引发关注。这是他一年内第三次访华,期间提到H20芯片重新获得出口许可,并宣布将在中国发售RTX Pro芯片,用于数字孪生和机器人领域。黄仁勋与雷军会面时表达了对小米汽车SU7 Ultra的兴趣,同时称赞中国新能源汽车产业创新。他还谈到硅谷AI抢人大战,认为Meta重金布局AI是明智之举。尽管英伟达刚成为全球首家市值突破4万亿美元的公司,黄仁勋却坦言自己‘没有梦想’,财务自由30年后更专注于推动技术进步和帮助他人。
原文链接
2025年7月,德国研究团队开发的AI模型Centaur登上《Nature》,成为首个跨领域精准预测人类认知的基础模型。该模型仅用5天训练时间,基于Llama 3.1 70B构建,参数量仅为原模型的0.15%,却能模拟160项心理学实验中的人类行为,涵盖决策、记忆、逻辑推理等任务。Centaur不仅在预测人类行为上超越传统模型,其神经表征与fMRI扫描结果高度吻合,显示出对人类大脑活动的深刻理解。研究人员通过多种实验验证其泛化能力,包括修改任务背景和结构,以及处理全新领域任务,均表现优异。Centaur或将推动统一认知理论的发展,为心理学研究提供新工具。
原文链接
7月14日,法治日报揭露‘代降论文AI率’乱象。因高校首次引入AI生成内容检测,要求论文AI率控制在15%-20%以内,部分学生为达标选择购买电商及社交平台上的‘代降’服务。这些服务收费从几十元至上千元不等,但效果堪忧,常见问题包括坐地起价、拖延交稿及修改后语句不通等,甚至以‘人工修改’为幌子实则依赖AI工具。受骗学生维权困难,卖家常以公开论文或举报学校相威胁。调查发现,该现象已形成灰色产业链,部分商家利用‘引流公式’吸引客户,声称‘十分钟赚200元’。专家提醒,此类服务存在高风险,学生应谨慎对待。
原文链接
7月13日,美国AI初创公司Perplexity CEO阿拉温德发文称赞月之暗面最新发布的Kimi K2模型,并表示公司可能基于K2进行后训练。Kimi K2是月之暗面推出的首个万亿参数开源模型,强调代码能力和通用Agent任务能力,采用MoE架构,总参数达1T,激活参数32B。该模型在SWE Bench Verified、Tau2、AceBench等基准测试中取得开源模型中的SOTA成绩,展现领先性能。此前,Perplexity曾使用DeepSeek R1进行模型训练。
原文链接
2025年7月11日,马斯克旗下AI模型Grok 4发布后引发热议。这款被称作“地球上最聪明的AI”在实测中表现两极化。编程方面,Grok 4在复杂任务如three.js动画生成、C语言代码编写中表现出色,但在物理模拟和UI设计上屡屡翻车。写作测试显示其语义连贯性强,但创意写作情节套路化、语言炫技。SVG图像生成任务中,Grok 4轮廓逻辑完整,但细节处理不足。推理能力较强,尤其在法律与财务场景分析中条理清晰,但图像理解能力仍有明显短板。尽管Grok 4技术深度不俗,部分基础任务却表现不佳,网友质疑其2万美元定价是否合理。与此同时,马斯克通过高话题度再次引发全球关注,而实际体验似乎并非其首要考虑因素。
原文链接
据《科创板日报》11日讯,亚马逊AWS计划在下周的AWS峰会上发布AI Agent市场,合作伙伴包括Anthropic。该平台将支持初创公司向AWS客户直接提供并销售其AI Agent。此前,谷歌和微软已推出类似市场,用于促进AI Agent的发布与交易。这一动态表明科技巨头正加速布局AI生态,推动AI技术商业化落地。(消息来源:TechCrunch)
原文链接
2025世界人工智能大会暨人工智能全球治理高级别会议将于上海举行,大会以“1+1+2+10+N”架构呈现,包括开幕式、主论坛、治理会议及多场生态论坛。80余位中外院士、12位顶奖得主及千余名嘉宾确认参会,覆盖30余个国家和地区。展览面积突破7万平方米,吸引800余家企业,展示3000余项前沿展品,涵盖大模型、AI终端、智能机器人等,其中百款新品为全球或中国首发。市外及国际企业占比超50%,国内龙头与西门子等外企共同亮相,规模创历届之最。(央视新闻)
原文链接
7月10日,马斯克在xAI直播中表示,Grok人工智能在大多数方面已超越人类智慧,但仍需改进图像训练。他指出,即便是最新版本Grok 4,仍存在盲区问题,预计需约一个月时间解决。这一发言揭示了Grok的技术进展及当前局限性,展现了AI发展中的新动态。
原文链接
2025年7月10日,上海市经信委主任张英在2025世界人工智能大会新闻发布会上表示,今年一季度上海规上人工智能产业规模超1180亿元,同比增长29%,利润增长65%,成为经济增长新引擎。预计到年底,全市智算供给能力将超100EFlops,并已构建智能算力资源统筹调度服务平台。上海成立全国首个专业化语料运营平台,汇聚超1800TB成品语料,发布5项首创标准,探索“众包、众创、众筹”机制。同时,基础大模型形成“1+3”开源与商业体系,多家机构加速AI开源、AI Agent及多模态技术商业化落地。
原文链接
加载更多
24小时热文
更多

-
2025-07-18 23:46:25
-
2025-07-18 22:47:06
-
2025-07-18 22:46:21