1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
Meta亿元天团首个大模型交卷!余家辉宋飏Jason Wei耗时九个月,一雪Llama前耻
2026年4月,Meta推出首个由‘亿元天团’打造的大模型Muse Spark,主打多模态能力。这款模型由亚历山大王带队,余家辉、宋飏、Jason Wei等顶尖专家耗时9个月完成,旨在弥补Llama系列的不足。发布后,Meta股价一度上涨10%,市场反响热烈。Muse Spark在多模态理解、推理及医学领域表现出色,但在编程和长时间自主任务上仍有差距。Meta此次采取闭源策略,仅向部分合作伙伴开放API,但计划未来开源后续版本。此外,模型新增‘沉思模式’以提升复杂推理能力,并上线个性化购物推荐功能。第三方测评显示,Muse Spark已重回人工智能第一梯队,仅次于Gemini 3.1 Pro、GPT-5.4等顶级模型。然而,部分用户反馈其在编程任务中表现不佳,存在翻车案例。
WisdomTrail
04-09 09:56:45
分享至
打开微信扫一扫
内容投诉
生成图片
老黄200亿「钞能力」回应谷歌:联手Groq,补上推理短板
2025年12月,英伟达以200亿美元收购AI芯片公司Groq,旨在应对谷歌TPU等新竞争者对其GPU主导地位的威胁。此次收购被视作英伟达补强推理能力的关键举措,因推理市场对低延迟需求远超GPU现有能力。Groq的LPU芯片采用片上SRAM技术,在decode阶段速度远超GPU和TPU,但内存容量有限,需大量芯片协同工作。业内人士指出,推理芯片市场竞争激烈,利润较低,但用户对速度的需求正快速增长。英伟达此举意在通过‘混搭’策略巩固其AI领域霸主地位,同时抵御新兴对手冲击。
元界筑梦师
12-28 22:46:20
分享至
打开微信扫一扫
内容投诉
生成图片
OpenAI o3-pro发布,也许当前的RAG过时了
OpenAI近日发布了o3-pro,号称最强推理AI模型,其推理能力显著提升。同时,OpenAI宣布o3的价格下调80%,使输入和输出token的成本分别降至2美元和8美元每百万,相比调整前大幅降低。这一价格已接近GPT-4o的水平,对开发者更具吸引力。o3-pro具备200k的上下文窗口和100k的最大输出token数,可支持约15万字的提示词输入,极大增强了RAG(检索增强生成)的能力。专家表示,更强的上下文支持和更低的成本将推动RAG技术在复杂应用场景中的进一步发展,包括医疗诊断、知识图谱构建及推理型任务等。尽管如此,模型对长文的理解仍有限,未来可能需要结合更多智能化策略优化性能。
镜像现实MirageX
06-17 18:31:23
分享至
打开微信扫一扫
内容投诉
生成图片
蚂蚁武威:下一代「推理」模型范式大猜想
标题:蚂蚁武威:下一代「推理」模型范式大猜想 正文: R1 后,长思维链成为下一代基础模型推理能力研究的热门方向。R1 表明大模型深度思考可行,但推理序幕才刚开启。R1 还影响了国内研究,激励更多人提出前瞻技术思想,蚂蚁技术研究院武威是典型代表。 武威本科和博士毕业于北大数学科学学院,曾获微...
LunarCoder
05-21 00:47:21
分享至
打开微信扫一扫
内容投诉
生成图片
360亿AI芯片独角兽,裁员15%
美国AI芯片独角兽SambaNova Systems近日宣布裁员77人,占员工总数约15%,以应对市场变化并聚焦AI推理业务。SambaNova成立于2017年,总部位于加州,曾计划开发统一架构的AI训练与推理芯片,但在最新一轮调整中转向专注AI推理。上一轮D轮融资使公司估值超50亿美元。SambaNova发言人表示,此次调整旨在适应从训练到推理的市场趋势,同时加速云优先解决方案布局。目前,AI推理芯片需求旺盛,SambaNova目标客户为企业市场,去年9月推出了SambaNova Cloud服务。其第四代处理器SN40L凭借数据流架构和三层内存架构,在AI推理效率上表现优异,测试显示其性能较GPU驱动系统快10倍以上。然而,面对英伟达的市场主导地位,SambaNova仍需应对激烈竞争。
智慧棱镜
05-09 19:56:29
分享至
打开微信扫一扫
内容投诉
生成图片
小米开源“Xiaomi MiMo”大模型:为推理而生,以 7B 参数超越 OpenAI o1-mini
4月30日,小米开源首个“为推理而生”的大模型Xiaomi MiMo。该模型由小米大模型Core团队开发,仅用7B参数规模,在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)中超越了OpenAI的o1-mini及阿里Qwen的QwQ-32B-Preview。MiMo的推理能力提升得益于预训练和后训练阶段的数据与算法创新。预训练阶段通过挖掘富推理语料合成200B tokens数据,并进行三阶段训练,总计25T tokens;后训练阶段采用Test Difficulty Driven Reward算法缓解奖励稀疏问题,引入Easy Data Re-Sampling策略稳定RL训练,同时设计Seamless Rollout系统加速RL和验证过程。MiMo已在Hugging Face和GitHub上开源,技术报告同步发布。
AI创想团
04-30 19:37:14
分享至
打开微信扫一扫
内容投诉
生成图片
三大模型巨头比拼思考“幻觉”:DeepSeek 不敌 ChatGPT,Gemini 用词最少
三大模型巨头比拼“幻觉”能力:ChatGPT优势明显,DeepSeek表现欠佳 近日,智利大学研究员Roberto Araya通过四组对照实验,比较了Gemini 2.0 Flash、ChatGPT o3-mini和DeepSeek R1在应对幻觉问题上的表现。实验结果显示,ChatGPT o3...
Nebula
03-28 15:55:43
分享至
打开微信扫一扫
内容投诉
生成图片
英伟达发布 Llama Nemotron 系列开放推理 AI 模型及 Cosmos Nemotron 新成员
3月20日,英伟达发布Llama Nemotron系列开放推理AI模型,支持智能体AI系统,能独立推理、规划和执行多步骤任务,适用于机器人、自动化及决策优化场景,大幅降低推理成本,推动企业AI自主化升级。该系列包括Nano、Super和Ultra三种规模,分别针对PC/边缘设备、单GPU部署和多GPU服务器优化。同时,英伟达推出Cosmos Nemotron新成员,专注于视觉语言模型(VLM),可解析图像、视频及传感器数据,扩展其Cosmos WFM平台能力,广泛应用于自动驾驶和工业机器人等多模态推理领域。
E-Poet
03-20 11:22:58
分享至
打开微信扫一扫
内容投诉
生成图片
老黄发布新核弹B300,英伟达:B200已破DeepSeek-R1推理世界纪录
标题:老黄发布新核弹B300,英伟达刷新推理性能纪录 皮衣“老黄”携最强AI芯片GB300亮相“AI超级碗”GTC,燃爆全场。与去年的GB200相比,GB300的推理性能提升了1.5倍,预计下半年出货。此外,老黄还预览了下一代AI超级芯片Vera Rubin,将于2026年下半年发货,其性能更是...
星际Code流浪者
03-19 07:13:10
分享至
打开微信扫一扫
内容投诉
生成图片
大模型全军覆没,中科院自动化所推出多图数学推理新基准
标题:中科院自动化所推出多图数学推理新基准MV-MATH 挑战多图数学推理新基准,大模型表现不佳? 近日,中国科学院自动化研究所推出多图数学推理数据集MV-MATH,旨在全面评估多模态大语言模型在多视觉场景中的数学推理能力。 结果显示,GPT-4o得分为32.1,类o1模型QvQ得分29.3,所有模...
E-Poet
03-11 14:34:37
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序