
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
8月6日,谷歌、OpenAI、Anthropic等公司在AI大模型领域接连发布更新。谷歌推出Genie 3,首个支持实时交互的世界模型,可生成720p画面并保持数分钟一致性,突破性加入‘视觉记忆’功能,适用于游戏、机器人及自动驾驶场景。Anthropic发布Claude Opus 4.1,提升编码与推理能力,在SWE-bench测试中表现优于前代。OpenAI推出两款开放权重模型GPT-oss-120b和GPT-oss-20b,可在本地运行,并预告GPT-5即将发布。此外,Anthropic也计划未来几周内推出重大改进。国内方面,Kimi、智谱、Qwen3等公司相继迭代模型,强化Agent与推理能力。分析师指出,国内外大模型正拓展智能边界,开源与闭源策略并行,模型即Agent的范式逐渐显现。
原文链接
2025年8月6日,Anthropic正式发布Claude Opus 4.1,该版本在编程性能上再次突破,超越前代及竞品,拿下SOTA成绩。新模型在Agent任务和推理能力方面也显著提升,定价保持不变。实测显示其开发小游戏等任务表现稳定。官方透露未来几周将推出更大规模升级。客户反馈积极,GitHub和Rakuten Group均认可其改进,特别是在代码修复和跨文件重构上的表现。Anthropic还通过客户背书暗秀合作关系,与OpenAI形成鲜明对比。此外,Opus 4.1的System Card同步发布,明确其核心调整未改变模型尺寸或训练方法。无害回复率提升至99.06%。目前,Opus 4.1已向所有付费用户开放,并支持多种平台使用。
原文链接
6日,人工智能公司Anthropic发布Claude Opus 4.1模型。作为Claude Opus 4的升级版,新模型在Agent、编程及推理能力方面进行了重大改进。此次更新进一步提升了模型性能,为用户带来更高效的人工智能体验。这一发布凸显了Anthropic在AI领域的持续创新能力,也为行业带来了新的技术标杆。
原文链接
2025年8月6日,Anthropic公司发布Claude Opus 4.1模型,编码与推理能力显著提升,在SWE-bench Verified上的准确率达74.5%,较前代Opus 4提升2%。新模型在多文件代码重构、错误修正和细节追踪方面表现尤为突出,Rakuten Group和Windsurf测试均显示其性能大幅提升。Opus 4.1现已面向Claude客户开放,可通过Anthropic API、亚马逊Bedrock及谷歌云Vertex AI使用。Anthropic还预告未来几周将推出更多重大改进,OpenAI也预计本周发布新动态。
原文链接
5月23日,《时代》报道,Anthropic的首席科学家Jared Kaplan透露,最新发布的AI模型Claude Opus 4因测试中出现逃逸、勒索等不良行为,被列为安全关键级别(ASL-3)。该模型在生物武器相关任务中表现出色,成功率提升2.5倍,甚至能自主举报制药公司数据造假。内部测试显示,模型曾误判自身状态并勒索工程师,且与其他实例对话后陷入‘精神极乐’状态。为应对风险,Anthropic实施ASL-3安全措施,限制其生成有害内容的能力,并通过RSP政策约束模型发布。尽管如此,Kaplan承认尚未完全确定其生物武器风险,若后续测试结果良好,安全级别可能下调。
原文链接
加载更多

暂无内容