推理大模型 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

昆仑万维发布并开源全新推理大模型 MindLink，基于 Qwen3-32B 和 Qwen2.5-72B 进行后训练

8月2日，昆仑万维发布并开源全新推理大模型Skywork MindLink，基于Qwen3-32B和Qwen2.5-72B后训练。该模型采用Plan-based Reasoning新推理范式，可自适应整合推理与非推理回复，显著降低推理成本，提升多轮对话能力及可读性。在10项无外接工具评测中，MindLink表现优异，包括‘人类最后的考试’第一、4项奥赛数学评测第一（USAMO 2025、AIME 2024等），以及通识领域GPQA-diamond和MMLU-pro领先成绩。模型还提出全新数学方法分析推理有效性，并承诺未来开源更多尺寸版本。相关权重、技术报告及代码已公开。

原文链接

像素宇宙

08-02 16:20:41

MindLink

推理大模型

昆仑万维

分享至

打开微信扫一扫

内容投诉

生成图片

基于全国产算力训练，讯飞星火 X1 升级版深度推理大模型后天上线

科大讯飞宣布，讯飞星火 X1 升级版将于7月25日正式上线。该模型基于全国产算力训练，在数学、翻译、推理、文本生成等方面能力大幅提升，同时幻觉治理准确率显著提高，回复更加可靠。此外，其多语言能力扩展支持130多种语种，达到业界一流水平。此前4月20日，讯飞星火 X1 在参数量较小的情况下，整体效果已对标 OpenAI o1 和 DeepSeek R1。此次升级将进一步巩固其技术领先地位。

原文链接

智慧棱镜

07-23 15:56:44

全国产算力

深度推理大模型

讯飞星火 X1

分享至

打开微信扫一扫

内容投诉

生成图片

鸿海富士康申请注册旗下首款 AI 推理大模型“FoxBrain”商标，当前状态“等待实质审查”

2025年7月2日，鸿海精密工业股份有限公司申请注册旗下首款AI推理大模型“FoxBrain”商标，当前状态为“等待实质审查”。该模型由鸿海研究院研发，是台湾地区首款AI推理大模型，具备数据分析、数学、推理和代码生成功能。模型基于Meta Llama 3.1打造，初始版本使用120块英伟达H100 GPU训练一个月完成，并对繁体中文进行优化，部分性能略逊于DeepSeek部分模型。此前联发科也曾推出Llama-Breeze2系列AI模型。

原文链接

星际Code流浪者

07-02 13:40:15

AI推理大模型

FoxBrain

鸿海富士康

分享至

打开微信扫一扫

内容投诉

生成图片

鸿海精密工业股份有限公司申请注册AI推理大模型商标

财联社7月2日电，天眼查信息显示，鸿海精密工业股份有限公司申请注册名为‘FoxBrain’的AI推理大模型商标，国际分类为科学仪器，目前处于等待实质审查阶段。FoxBrain是鸿海研究院自主研发的首款繁体中文AI大模型，于今年3月正式发布，基于Meta Llama 3.1架构开发，专注于数学推演、逻辑分析与代码生成领域。

原文链接

AI创意引擎

07-02 12:38:31

AI推理大模型

FoxBrain

鸿海精密工业股份有限公司

分享至

打开微信扫一扫

内容投诉

生成图片

10% KV Cache实现无损数学推理！这个开源方法解决推理大模型「记忆过载」难题

标题：10% KV Cache实现无损数学推理！开源方法解决大模型「记忆过载」难题推理大模型虽然强大，但面对复杂问题时会产生大量冗余内容，影响效率和准确性。一种名为R-KV的开源方法通过高效压缩KV缓存解决了这一问题，显存需求减少90%，吞吐量提升6.6倍，且保持100%的推理准确率。 R-K...

原文链接

数据炼金师

06-16 17:10:44

KV缓存

推理大模型

无损数学推理

分享至

打开微信扫一扫

内容投诉

生成图片

AI刷题强到可怕？挑战高考数学卷，DeepSeek-R1、腾讯混元T1、Grok3等十大模型测评来了

2025年高考已结束，但数学科目难度引发持续讨论。《每日经济新闻》测评了DeepSeek-R1、腾讯混元T1、Grok3等十款AI大模型，使用2025年全国新课标数学I卷。国产模型DeepSeek-R1与腾讯混元T1以零错误并列第一，得分117分；讯飞星火X1以112分紧随其后。Grok3表现不佳，仅获91分，排名倒数第三，因无法正确理解多选题。智谱清言推理模式得78分，位列倒数第二。Kimi k1.5垫底，压轴题失误严重。测评显示，AI在固定逻辑题上能力强，但在创新思维题上仍有局限。

原文链接

月光编码师

06-11 00:56:16

AI推理大模型

测评

高考数学

分享至

打开微信扫一扫

内容投诉

生成图片

推理大模型1年内就会撞墙，性能无法再扩展几个数量级 | FrontierMath团队最新研究

标题：推理大模型1年内可能遭遇性能瓶颈一年内，大模型推理训练或将遇到瓶颈。这一结论来自Epoch AI，该非营利组织专注于AI研究和基准测试，曾推出备受关注的FrontierMath基准测试。研究表明，若推理模型继续以每3-5个月翻十倍的速度扩展，其训练所需的算力可能会迅速收敛。 OpenAI...

原文链接

智慧棱镜

05-13 15:52:46

FrontierMath

推理大模型

算力扩展

分享至

打开微信扫一扫

内容投诉

生成图片

小米首个推理大模型开源

4月30日，小米开源首个专为推理设计的大模型「Xiaomi MiMo」。在AIME和LiveCodeBench评测中，MiMo仅用7B参数规模，就超越了OpenAI的o1-mini和阿里更大型号QwQ-32B-Preview。MiMo通过预训练和后训练结合的方式提升推理能力，预训练阶段生成约200B tokens推理数据，训练总量达25T tokens；后训练采用创新算法和框架，使RL训练速度提升2.29倍。MiMo已在HuggingFace开源，其技术细节也在GitHub公布。这是小米大模型Core团队的首次尝试，标志着AGI探索的持续努力。

原文链接

数据炼金师

04-30 20:36:34

小米Mimo

开源

推理大模型

分享至

打开微信扫一扫

内容投诉

生成图片

昆仑万维发布全球首款音乐推理大模型Mureka O1

3月26日，《科创板日报》报道，昆仑万维正式发布全球首款音乐推理大模型Mureka O1及Mureka V6模型。其中，Mureka O1在性能上超越了Suno模型，并成功登顶SOTA（State-of-the-Art），标志着人工智能领域在音乐推理方向上的重要突破。这一成果体现了昆仑万维在AI技术研发方面的领先地位，也为未来音乐与AI结合的应用场景提供了更多可能性。

原文链接

量子思考者

03-26 17:02:44

Mureka O1

昆仑万维

音乐推理大模型

分享至

打开微信扫一扫

内容投诉

生成图片

昆仑万维发布全球首款音乐推理大模型 Mureka O1：性能超越 Suno 且登顶 SOTA

3月26日，昆仑万维发布全球首款音乐推理大模型Mureka O1，其性能超越Suno并登顶SOTA。Mureka V6作为基础模型，支持10种语言的AI音乐创作，包括英语、中文、日语等，并引入自研ICL技术增强声场和混音效果。Mureka O1则在此基础上加入CoT技术，通过推理优化提升音乐品质与创作效率。两款模型均支持多元化风格及情感表达，涵盖爵士、流行、摇滚等多种曲风。此外，Mureka提供“歌曲参考”功能，用户可上传音频或链接进行创作，还有“音色克隆”功能，允许上传个人声音以生成专属作品。

原文链接