1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
杨植麟GTC上披露Kimi技术路线:押注Token效率、长上下文及Agent集群
3月18日凌晨,英伟达GTC大会上,月之暗面Kimi创始人杨植麟发表演讲,首次系统披露Kimi技术路线。他强调,突破大模型智能上限需重构优化器、注意力机制等底层技术,并提出Kimi进化逻辑的三大维度:Token效率、长上下文及智能体集群(Agent Swarms)。杨植麟指出,Scaling已不再是单纯资源堆砌,而需在计算效率、长程记忆和自动化协作上寻找规模效应。他认为,将这三者的技术增益叠加,可大幅提升模型智能水平,未来智能形态将从单智能体向动态生成的集群进化。这是继1月底发布Kimi K2.5后,其技术思路的首次全面公开。(记者 李明明)
数字墨迹
03-18 12:13:34
分享至
打开微信扫一扫
内容投诉
生成图片
清华刘知远团队论文:最小化结构改动,短文本到长文本丝滑升级 | ICLR 2026
标题:清华刘知远团队论文:最小化结构改动,短文本到长文本丝滑升级 | ICLR 2026 正文: 大语言模型的“上下文长度”已成为制约其能力的关键瓶颈。长文档理解、跨轮对话记忆等任务对序列长度的需求远超传统4k或8k,而Transformer架构的全注意力机制在序列增长时带来平方级计算与显存开销...
超频思维站
02-06 20:12:11
分享至
打开微信扫一扫
内容投诉
生成图片
推理算力“正在耗尽”?百万Token时代来临 产业打响新一轮竞逐
9月13日,AI领域焦点从模型参数增长转向推理算力需求。英伟达发布专为长上下文推理设计的Rubin CPX GPU,称其投资回报率可达50倍,远超以往产品,并在MLPerf推理基准测试中创纪录。甲骨文创始人Larry Ellison指出,AI推理市场将远大于训练市场,且推理算力正被快速耗尽。数据显示,Google、微软和字节等大厂Token调用量呈爆发式增长,行业对长上下文需求激增。东吴证券认为,Rubin CPX推出标志着算力基建进入分工协作新阶段,硬件与软件耦合度提升,GPU、存储等相关厂商有望受益。
星际Code流浪者
09-13 18:29:27
分享至
打开微信扫一扫
内容投诉
生成图片
MiniMax M1全球技术闭门会实录:RL、混合架构、长上下文的下一步
MiniMax M1全球技术闭门会探讨了RL、混合架构及长上下文的前沿话题。 RL能否赋予模型新能力? RL在有限上下文长度下能提升模型能力,通过改变输出分布优化性能。例如,预训练需10万token解决的问题,经RL可能仅需1万token。然而,Reward Modeling仍是核心瓶颈,尤其是非结...
LunarCoder
07-22 13:32:06
分享至
打开微信扫一扫
内容投诉
生成图片
最强3B「小钢炮」,代码数据全公开!推理随意开关,128k超长上下文
2025年7月11日,Hugging Face发布新一代最强30亿参数小模型SmolLM3,支持128k超长上下文、双推理模式(think/no_think)及多语言处理。该模型性能超越Llama3.2-3B和Qwen2.5-3B,逼近40亿参数模型,并完全开源训练、对齐、架构与数据。团队通过优化架构(如GQA机制、NoPE编码)及三阶段训练策略提升模型能力,尤其在数学、编程和长文本任务中表现优异。此外,SmolLM3引入双模式指令模型构建方案,平衡推理与非推理性能,支持工具调用与灵活场景适配。研究者可通过transformers库轻松部署,模型已在Hugging Face平台开放下载。
超频思维站
07-11 11:34:58
分享至
打开微信扫一扫
内容投诉
生成图片
Gemini 2.5 Pro负责人:最强百万上下文,做好了能解锁很多应用场景
Gemini 2.5 Pro模型在AI编程实践中,能够直接读取整个项目,带来全新的体验。长上下文能革新产品交互并开启全新应用场景。谷歌DeepMind的Nikolay Savinov指出,当前百万级token上下文质量尚未完美,盲目追求更大规模意义不大;随着成本下降,千万级token上下文将成为标准...
AGI探路者
07-01 08:52:17
分享至
打开微信扫一扫
内容投诉
生成图片
MiniMax的好日子来了?
MiniMax的好日子来了? 昨天凌晨,MiniMax正式开源了首个推理模型M1。尽管在基准测试中表现平平,但M1拥有业界最长的上下文能力:100万token输入与8万token输出。与此同时,MiniMax正在邀请用户测试其通用Agent。 错失先发优势后,这家曾被视为AI六小龙中最稳健的公司,正...
心智奇点
06-18 21:51:36
分享至
打开微信扫一扫
内容投诉
生成图片
GPT-4.1淘汰了4.5!全系列百万上下文,主打一个性价比
OpenAI推出GPT-4.1系列模型,主打性价比。该系列包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano三个版本,均支持百万token上下文窗口。相比GPT-4.5,GPT-4.1在编码、指令遵循及长上下文理解等方面表现更优。例如,在SWE-bench Verified测试中,GPT-4.1得分54.6%,提升显著;在MMLU基准测试中,GPT-4.1 mini以87.5%的成绩超越GPT-4o的85.7%,且成本更低。此外,GPT-4.1在长上下文检索与多跳推理测试中亦表现优异。OpenAI计划用GPT-4.1取代GPT-4.5,后者将于2025年7月14日下架。尽管性价比提高,GPT-4.1仍逊于DeepSeek R1。
WisdomTrail
04-15 10:24:50
分享至
打开微信扫一扫
内容投诉
生成图片
MiniMax震撼开源,突破传统Transformer架构,4560亿参数,支持400万长上下文
MiniMax于2025年初开源了最新的基础语言模型MiniMax-Text-01和视觉多模态模型MiniMax-VL-01,该模型拥有4560亿参数,支持400万token长上下文。MiniMax-Text-01通过新型线性注意力机制和混合专家架构,显著提高了长上下文处理能力。在基准测试中,MiniMax-Text-01表现出色,尤其是在长上下文理解和推理任务上。MiniMax-VL-01则结合了图像编码器,增强了多模态处理能力。这些模型有望推动AI Agent在2025年的广泛应用。
智能维度跳跃
01-16 10:52:27
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序