
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
1月30日,微软CEO穆斯塔法・苏莱曼宣布,所有Microsoft Copilot用户现可免费使用OpenAI的o1推理模型。这使得深度思考功能不再限于付费用户,所有用户均可利用此功能进行复杂多步骤的结构化推理。深度思考功能于2024年10月首次在Copilot Labs推出,旨在提高回复的深度和准确性。用户只需点击“深度思考”按钮,AI将在约30秒内生成经过充分推理的回复。苏莱曼还透露微软正筹备更多AI扩展项目。
原文链接
昨日1月20日,DeepSeek团队发布了全新开源模型DeepSeek-R1,迅速获得4k+星。该模型打破了传统训练模式,未使用SFT数据,仅通过RL训练,展示了自主思考的能力。DeepSeek-R1在多项基准测试中与OpenAI o1不相上下,尤其在数学和编程竞赛中表现出色。模型还开源了多个小模型,参数从1.5B到70B,性能超越GPT-4o等竞品。DeepSeek-R1的训练方法包括Self play、Grpo及Cold start,使其成本仅为o1的五十分之一,效能却相当。
原文链接
1月20日,幻方量化旗下AI公司深度求索(DeepSeek)发布了DeepSeek-R1模型,并同步开源模型权重。该模型在数学、代码、自然语言推理等任务上性能与OpenAI o1正式版相当。DeepSeek称,蒸馏小模型超越OpenAI o1-mini,开源了两个660B模型及6个蒸馏小模型。DeepSeek-R1 API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。此外,DeepSeek统一采用MIT License,明确支持用户进行模型蒸馏。
原文链接
英伟达发布全新AI芯片B300及超级芯片GB300,相比B200,B300在FLOPS上提升了50%,显存从192GB增加到288GB。GB300 NVL72被评价为唯一能让OpenAI o1/o3推理大模型达到10万tokens的方案。自第三季度起,多家AI巨头已将订单从B200转向B300。B300的升级主要来自工艺节点优化、功率提升及架构微创新。GB300系列改为参考板模式,为OEM和ODM制造商带来新机会。B300显著提升推理大模型的思维链长度和处理效率,降低成本,提高用户体验。
原文链接
谷歌发布了实验性的Gemini 2.0 Flash Thinking模型,其推理能力强大,水平堪比理科博士生。该模型能在1到3秒内快速准确解答复杂问题,且支持逐步推理展示。目前,Gemini 2.0 Flash Thinking已上线Google AI Studio和Vertex AI,位居Chatbot Arena LLM排行榜首位。此模型不仅能处理文本,还能分析图像,为解决多类型数据问题提供了新手段。谷歌CEO Sundar Pichai称其为迄今为止最周到的模型。
原文链接
11月26日,月之暗面发布了基于k0-math模型的Kimi数学版,该模型在多个数学基准测试中表现出色。根据官方声明,Kimi数学版支持用户通过截图或拍照方式输入数学问题,并能自动转换为LaTeX格式,方便用户使用。在中考、高考、考研及MATH竞赛题基准测试中,k0-math初代模型的成绩超过了OpenAI的o1-mini和o1-preview。此外,在更难的OMNI-MATH和AIME竞赛题库中,k0-math初代模型的表现分别达到o1-mini最高成绩的90%和83%。Kimi数学版的推出,标志着k0-math模型能力对标OpenAI的o1模型。此次更新进一步提升了数学问题处理的效率与准确性,适用于各类数学考试和竞赛。
原文链接
标题:大模型推理能力的脆弱性揭示
一个月前,OpenAI发布的o1在处理复杂推理任务时展现出非凡能力,尤其在解答难度极高的数学问题时表现出色。然而,最近的研究揭示了大模型推理能力的脆弱性。
一篇名为《理解大语言模型在数学推理的局限性》的论文指出,向大模型提出的问题中加入无关信息,即使是简单的小学数学...
原文链接
《一文看懂OpenAI最强推理模型o1:如何使用及为何存在争议》
OpenAI的最新模型o1发布一周,如同洋葱般层层包裹,令人琢磨不透。它以独特的方式在回答问题前思考,形成复杂的思维链,模仿人类解决复杂问题的过程。这种设计源于强化学习训练,使o1在推理能力上超越以往,尤其在数学、代码等领域表现出色。...
原文链接
【新闻摘要】
OpenAI发布的新模型o1在lmsys排行榜上全面超越Claude和谷歌Gemini模型,成为数学领域的佼佼者。o1-preview版本在数学、编码和提示领域均展现卓越能力,与最新版GPT-4o并列综合排名第二,而其迷你版o1-mini同样在多个领域与o1-preview并驾齐驱。...
原文链接
OpenAI的最新模型o1在复杂逻辑推理能力上展现出博士级水准,成功解决了此前语言模型LLMs难以应对的问题,如判断"9.9和9.11哪个更大"。这一成就引发讨论,有人担忧中国AI在追赶OpenAI的过程中可能会越来越落后。然而,通过深入分析OpenAI的发展路径——包括GPT路线、Sora路线及o...
原文链接
加载更多

暂无内容