1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
Epoch AI 预言:最快 1 年内,推理模型步伐将放缓
Epoch AI 最新报告显示,AI 企业从推理模型中获取巨大性能收益将变难,最快一年内推理模型进步将放缓。报告基于公开数据和假设,指出了计算资源限制和研究开销增加的问题。推理模型依赖强化学习技术优化难题解决能力,但需更多计算资源处理复杂任务。OpenAI 在 o3 模型训练中投入 10 倍于 o1 的计算资源,未来计划进一步加大强化学习投资。尽管强化学习性能每 3-5 个月增长十倍,但其增长面临物理与经济约束,可能在 2026 年与整体 AI 前沿进展趋同。Josh You 警告,高研究开销或使推理模型难以实现预期规模。
蝶舞CyberSwirl
05-14 09:09:06
AI推理模型
强化学习
性能增长
分享至
打开微信扫一扫
内容投诉
生成图片
微软发布 Phi-4 系列小语言 AI 推理模型,AIME 2025 跑分超满血版 Deepseek R1
4月30日,微软发布Phi-4推理模型系列,包括Phi-4-reasoning、Phi-4-reasoning-plus及Phi-4-mini-reasoning三款。Phi-4-reasoning采用140亿参数,通过监督微调Phi-4和OpenAI o3-mini数据集训练,擅长复杂推理任务,尤其在数学和科学问题上表现优异,在AIME 2025测试中超越6710亿参数的DeepSeek-R1满血版。增强版Phi-4-reasoning-plus通过强化学习进一步提升性能,tokens用量增加1.5倍。Phi-4-mini-reasoning则针对资源受限环境设计,3.8亿参数下已在多项基准测试中超越更大规模的模型,适用于教育和边缘设备场景。
GhostPilot
05-01 16:28:11
AI推理模型
Phi-4
微软
分享至
打开微信扫一扫
内容投诉
生成图片
AI“推理”模型兴起,基准测试成本飙升
近日,随着AI推理模型的兴起,基准测试成本显著上升。据第三方机构“人工智能分析”数据,评估OpenAI的o1推理模型需花费2767.05美元,远高于非推理模型GPT-4o的108.85美元。类似地,Anthropic的Claude 3.7 Sonnet测试成本为1485.35美元,而其非推理版本仅需81.41美元。高昂的成本主要源于推理模型生成大量token,且现代基准测试更复杂,涉及多步骤任务。例如,OpenAI的o1生成超4400万个token,是GPT-4o的八倍。尽管模型性能提升,测试成本仍居高不下。AI初创公司“通用推理”的CEO罗斯·泰勒指出,MMLU Pro测试单次成本已超1800美元。专家警告,免费或补贴的模型测试可能影响评估公正性。截至发稿,相关机构正计划扩大测试预算以应对这一挑战。
智慧棱镜
04-13 10:34:23
AI推理模型
基准测试
测试成本
分享至
打开微信扫一扫
内容投诉
生成图片
消息称微软正开发内部 AI 推理模型,并测试 xAI、DeepSeek 等多种 OpenAI 替代方案
据The Information报道,微软正在开发内部AI推理模型,计划与OpenAI竞争,并可能向开发者出售。微软测试了xAI、DeepSeek等模型,作为Copilot中OpenAI的替代方案。去年12月消息称,微软正整合内部和第三方AI模型,减少对OpenAI技术的依赖。今年1月,微软CEO宣布所有Copilot用户可免费使用OpenAI的o1推理模型,该功能允许Copilot分多步骤处理复杂查询。1月30日,微软推出针对NPU优化的DeepSeek-R1,首批面向搭载高通骁龙X芯片的Copilot+ PC。
智能视野
03-07 23:15:11
AI推理模型
DeepSeek
xAI
分享至
打开微信扫一扫
内容投诉
生成图片
吴恩达推出免费课程,带你玩转 OpenAI 推理模型 o1
吴恩达(Andrew Ng)于12月19日在LinkedIn宣布,其公司DeepLearning.AI推出免费短期课程《Reasoning with o1》,旨在帮助用户掌握OpenAI推理模型o1的功能。该课程教授如何优化o1模型,涵盖任务识别、新提示技术、多步骤编排、编码及图像理解等内容。课程还强调了meta-prompting和强化学习在提高o1性能中的作用。DeepLearning.AI目前提供超过50门免费课程,介绍生成式AI产品的技术和安全部署方法。
虚拟织梦者
12-21 14:57:27
DeepLearning.AI
OpenAI推理模型
吴恩达
分享至
打开微信扫一扫
内容投诉
生成图片
谷歌发布首个AI推理模型
12月19日,谷歌发布首个AI推理模型“Gemini 2.0 Flash Thinking”。该模型可在Google AI Studio和Vertex AI平台使用,能够展示思考过程以解决复杂问题。谷歌表示这只是推理能力发展的第一步,未来可能集成到Gemini 2.0系列主要模型中。
代码编织者
12-20 09:26:47
AI推理模型
Gemini 2.0
谷歌
分享至
打开微信扫一扫
内容投诉
生成图片
阿里云通义团队发布AI推理模型
【阿里云发布AI推理模型QwQ-32B-Preview并开源】 阿里云通义团队于今日发布了一款名为QwQ-32B-Preview的AI推理模型,并同步进行了开源。这款模型作为通义千问Qwen系列的实验性研究成果,是阿里云首次公开的AI推理模型。评测结果显示,QwQ在数学和编程领域展现出了研究生水平的科学推理能力,尤其在逻辑分析方面表现突出。此次发布不仅展示了阿里云在AI领域的技术实力,也为开发者提供了新的工具选择。该模型的开源有助于推动AI技术的进一步发展与应用。(记者 黄心怡) 注:本文核心信息包括发布时间、模型名称、技术背景及主要性能特点,符合新闻摘要的要求。根据要求,这里调整为更接近200字的长度,同时保持了关键信息的完整性。
虚拟织梦者
11-28 16:33:43
AI推理模型
QwQ
阿里云
分享至
打开微信扫一扫
内容投诉
生成图片
黎曼猜想,AI推理模型的梗
标题:黎曼猜想,AI推理模型的梗 马斯克正利用其新组建的10万张H100卡集群训练大模型Grok-3,目标是在12月甚至更早推出。 当地时间周六晚,xAI技术员工Hieu Pham在X上宣布:“Grok-3刚刚证明了黎曼猜想。我们决定暂停训练以验证其证明,如果证明正确,训练将不再恢复,因为该AI被认...
DreamCoder
11-18 10:34:12
AI推理模型
证明
黎曼猜想
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序