11月12日,月之暗面团队在Reddit举行AMA活动,联合创始人杨植麟等人回应热点议题。针对Kimi K2 Thinking模型训练成本仅460万美元的传言,杨植麟澄清非官方数据,并透露正研究其视觉-语言版本。团队还解释了推理长度过长等问题,称优先考虑性能,未来将优化token效率。此外,月之暗面开源混合线性注意力架构Kimi Linear,其技术或用于K3模型。谈及开源安全性,杨植麟强调开放对齐技术栈的重要性。团队还调侃OpenAI,表示不计划开发AI浏览器,专注模型训练。最后,他们回应上下文窗口扩展计划,未来可能支持更长上下文,展现了中国AI创新能力的全球认可。
原文链接
本文链接:https://kx.umi6.com/article/28216.html
转载请注明文章出处
相关推荐
换一换
华为UCM推理记忆管理技术正式开源
2025-11-05 16:17:45
阿里云通义千问开源 Qwen3-VL-30B-A3B 模型:智能体任务等领域媲美 GPT-5-Mini
2025-10-04 14:01:20
腾讯混元开源视频音效生成模型
2025-08-28 16:29:54
超越 GPT-5 Nano,阿里通义 Qwen3-VL 系列全新成员 4B 与 8B 模型开源上线
2025-10-15 13:33:22
月之暗面 Kimi K2 宣布更新:上下文长度扩展至 256K,带来更快的 API
2025-09-05 12:17:23
性能超OpenAI、Gemini!月之暗面发布首个自主强化学习Agent
2025-06-23 09:22:20
美团发布开源 LongCat-Video 视频生成模型,可稳定输出 5 分钟级内容
2025-10-27 11:55:56
Hugging Face开源小参数模型SmolLM3
2025-07-09 07:58:36
英伟达开源Newton引擎与GR00T N1.6模型
2025-09-30 08:28:35
上传一张图、主演任何视频,“性能最强动作生成模型”阿里通义万相 Wan2.2-Animate 开源
2025-09-19 15:14:57
昆仑万维发布并开源Matrix-Game 2.0模型
2025-08-12 10:17:03
Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……
2025-11-04 12:11:12
字节跳动开源其 AI IDE 工具核心组件 Trae-Agent
2025-07-07 08:24:33
588 文章
321692 浏览
24小时热文
更多
-
2025-11-12 13:04:09 -
2025-11-12 13:01:59 -
2025-11-12 12:03:46