1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
DeepSeek V3.2爆火,Agentic性能暴涨40%解密
2025年12月5日,DeepSeek V3.2发布,其Agentic性能提升40%,关键在于引入‘交错思维链’(Interleaved Thinking)机制。该技术通过在推理与工具调用间交替记录思考状态,显著增强了模型的长程规划能力,解决了AI‘健忘症’问题。类似的技术已在MiniMax M2、Kimi K2 Thinking等模型中应用,并取得显著效果,尤其在高扰动环境下的任务表现提升明显。这一机制不仅优化了复杂场景中的稳定性,还推动了行业基础设施升级。目前,交错思维链已成为智能体进化的核心路径,多家公司正合力推动其标准化。AWS re:Invent 2025大会上,亚马逊宣布将MiniMax M2纳入Amazon Bedrock模型库,彰显行业共识。
电子诗篇
12-05 17:41:21
Agent能力
DeepSeek V3.2
交错思维链
分享至
打开微信扫一扫
内容投诉
生成图片
谷歌最强大模型付费上线,在DeepSeek开源后被吐槽太贵
2025年12月5日,谷歌正式上线其最新模型Gemini 3 Deep Think,主打复杂推理能力,可将草图转化为3D场景、生成精细程序等。该模型在多项基准测试中表现优异,例如Humanity’s Last Exam准确率达41%,ARC-AGI-2代码执行准确率高达45.1%,远超GPT-5 Pro和Gemini 3 Pro。然而,其仅向Ultra会员开放,月费249.9美元(约合人民币1800元),引发用户不满,Pro用户尤其批评缺乏试用机会。与此同时,开源模型DeepSeek-V3.2近期同样取得显著成绩,且完全免费,进一步凸显谷歌高价策略的争议性。行业评论认为,开源模型正对闭源产品形成冲击,谷歌此举或面临市场冷遇。
阿达旻
12-05 14:31:30
DeepSeek开源
Gemini 3 Deep Think
模型定价
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeekV3.2技术报告还是老外看得细
12月4日,DeepSeek发布两款开源模型DeepSeek-V3.2和DeepSeek-V3.2-Speciale,在硅谷引发热议。新模型在智能体评测中达到开源模型最高水平,大幅缩小与顶尖闭源模型的差距。其中,标准版性能接近GPT-5,特别版超越GPT-5并在IMO、CMO等竞赛中获金牌,媲美Gemini-3.0-Pro。研究者苟志斌指出,强化学习在长上下文长度下也能持续扩展,突破了后训练瓶颈。此外,DeepSeek-V3.2系列成本极低,比GPT-5便宜近24倍,推理成本下降75%-83%。该模型还可能支持国产算力部署,进一步降低使用门槛,挑战谷歌、OpenAI及英伟达的技术和商业格局。
AI幻想空间站
12-04 09:09:55
DeepSeek-V3.2
开源模型
强化学习
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek的一次小更新:暴打OpenAI 追上Gemini
12月1日,DeepSeek发布两款新模型——DeepSeek V3.2和DeepSeek-V3.2-Speciale。前者性能与GPT-5相当,后者更在多项基准测试中追平闭源模型天花板Gemini,并在IMO 2025、CMO 2025等竞赛中斩获金牌。此次更新通过稀疏注意力(DSA)优化长文本处理能力,显著降低计算成本,同时强化后训练阶段投入超10%总算力提升模型表现。此外,DeepSeek优化了工具调用逻辑,改进Agent能力,并推出支持深度思考的特殊版本Speciale。尽管其Token消耗量较高,但价格仅为Gemini的1/20,性价比突出。DeepSeek持续以算法创新缩小开源与闭源模型差距,展现技术巧思。
AI幻想空间站
12-03 00:44:54
DeepSeek
开源模型
稀疏注意力
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek V3.2与国外顶级AI有差距:算力受限 未来会解决
12月2日,DeepSeek低调发布DeepSeek V3.2正式版及长思考加强版。官方称其在推理类Benchmark测试中达到GPT-5水平,略低于Gemini-3.0-Pro,并取得IMO国际数学奥赛等金牌水平。然而,编程领域表现不及Claude、Gemini-3.0-Pro等顶级AI。DeepSeek承认,模型因总训练FLOPS较少、标记效率低等问题存在局限性,未来将通过扩展算力和数据资源解决。V4或R2版本预计春节前后发布,有望实现更强大性能。
蝶舞CyberSwirl
12-02 21:35:41
DeepSeek V3.2
算力受限
顶级AI
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek-V3.2系列开源,性能直接对标Gemini-3.0-Pro
2025年12月,DeepSeek发布V3.2系列开源模型,包含DeepSeek-V3.2和DeepSeek-V3.2-Speciale。前者适用于日常问答与工具调用,推理能力达GPT-5水平;后者聚焦极致推理,性能媲美Gemini-3.0-Pro,并斩获IMO、CMO、ICPC等竞赛金牌。V3.2采用DSA稀疏注意力机制,大幅降低长文本处理成本,在Agent任务中表现突出,支持思考融入工具调用。Speciale版本强化数学推理与逻辑验证,但未优化日常对话,且仅供研究使用。团队投入超预训练10%的算力用于强化学习,开发自动环境合成pipeline,生成大量复杂任务数据。尽管世界知识广度仍逊于闭源模型,DeepSeek-V3.2在多项基准测试中超越现有开源模型,展现强大泛化能力。
智慧轨迹
12-01 22:37:15
Agent任务
DeepSeek-V3.2
Gemini-3.0-Pro
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek发布两款新模型
12月1日,DeepSeek发布两款新模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。DeepSeek-V3.2强化了Agent能力,官方网页端、App及API均已更新为正式版。Speciale版本目前仅以临时API形式开放,供社区评测与研究。这一更新标志着DeepSeek在AI模型领域的进一步拓展。(记者 张洋洋)
小阳哥
12-01 19:31:03
Agent能力
DeepSeek
模型发布
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek V3.2 正式版发布:推理比肩 GPT-5,首推 Speciale 版本拿下奥数金牌
2025年12月1日,DeepSeek V3.2 正式版发布,包含 DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale 两个版本。V3.2 推理能力比肩 GPT-5,适合日常问答和通用任务;Speciale 版本则专攻复杂推理,斩获 IMO、CMO、ICPC、IOI 金牌,表现媲美人类顶尖选手。Speciale 还结合了数学证明与逻辑验证能力,但成本较高,仅限研究使用。新模型支持思考模式与工具调用,强化 Agent 能力,并通过大规模合成数据提升泛化性能。DeepSeek-V3.2 在智能体评测中达到开源模型最高水平,缩小与闭源模型差距。开源地址已公布,供社区评测与研究。
神经网络领航员
12-01 19:27:59
DeepSeek V3.2
Speciale
推理能力
分享至
打开微信扫一扫
内容投诉
生成图片
deepseek当选网易有道词典2025年度词汇,全年搜索量超867万次
12月1日,网易有道词典揭晓2025年度词汇为“deepseek”,全年搜索量超867万次。该词因国产大模型DeepSeek的技术突破备受关注,用户查词后还延伸学习AI相关知识。有道词典通过强化AI能力优化了查词体验,助推技术词汇的热度攀升。“deepseek”被网友亲切称为“D老师”,其释义“深度求索”引发共鸣,体现中国AI行业的创新探索态势。从2011年起,有道词典每年发布年度热词,记录社会变迁。去年的“damn”代表情感表达,而今年转向技术求索,凸显人工智能对语言环境的深远影响。专家指出,这一变化具有重要的社会观察价值。
星际Code流浪者
12-01 18:22:41
AI技术
DeepSeek
年度词汇
分享至
打开微信扫一扫
内容投诉
生成图片
DeepSeek再破谷歌OpenAI垄断:开源IMO数学金牌大模型
2025年11月,DeepSeek开源全新数学模型DeepSeekMath-V2,专注自验证数学推理,打破谷歌和OpenAI在该领域的垄断。该模型在IMO 2025、CMO 2024及Putnam 2024竞赛中表现卓越,尤其在Putnam中以118/120超越人类最高分90分,并在代数、几何、数论等CNML级别问题上全面领先GPT-5-Thinking-High和Gemini 2.5-Pro。DeepSeekMath-V2采用迭代强化学习循环优化证明生成与验证,首次实现完全自动化数据标注流程,显著提升模型能力。此模型由研究员邵智宏主导开发,他曾提出经典算法GRPO并参与多个重要项目。这一成果标志着开源AI在复杂数学推理领域的重要突破。
像素宇宙
11-28 13:28:13
DeepSeekMath-V2
IMO金牌模型
自验证数学推理
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序