综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年12月,DeepSeek发布V3.2系列开源模型,包含DeepSeek-V3.2和DeepSeek-V3.2-Speciale。前者适用于日常问答与工具调用,推理能力达GPT-5水平;后者聚焦极致推理,性能媲美Gemini-3.0-Pro,并斩获IMO、CMO、ICPC等竞赛金牌。V3.2采用DSA稀疏注意力机制,大幅降低长文本处理成本,在Agent任务中表现突出,支持思考融入工具调用。Speciale版本强化数学推理与逻辑验证,但未优化日常对话,且仅供研究使用。团队投入超预训练10%的算力用于强化学习,开发自动环境合成pipeline,生成大量复杂任务数据。尽管世界知识广度仍逊于闭源模型,DeepSeek-V3.2在多项基准测试中超越现有开源模型,展现强大泛化能力。
原文链接
2025年11月,谷歌AI Studio一款神秘模型(疑似Gemini-3)成功破解了200多年前一位奥尔巴尼商人的潦草账本,震惊学界。该模型不仅以接近满分的准确率完成手写转写,还纠正了账本中的格式错误和模糊表述,并通过历史货币与重量系统的多步换算澄清复杂记录。测试显示,其字符错误率(CER)为1.7%,词错误率(WER)为6.5%,排除大小写和标点后更降至0.56%和1.22%,达到人类专家级水准。这一突破标志着AI在模式识别与推理能力上的重大跃迁,或暗示机器开始具备抽象符号化推理能力,引发广泛关注与讨论。
原文链接
加载更多
暂无内容