1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
月之暗面公开RL训练加速方法:训练速度暴涨97%,长尾延迟狂降93%
2025年11月,月之暗面联合清华大学推出全新强化学习加速引擎Seer,显著提升LLM训练效率。该框架通过推理引擎池、请求缓冲区和上下文管理器三大模块,结合分段生成、上下文感知调度及自适应分组推测解码技术,实现Rollout效率提升74%~97%,长尾延迟减少75%~93%。实验表明,Seer在Moonlight、Qwen2-VL-72B等模型任务中性能大幅超越基线系统veRL,尤其在长尾延迟优化上表现突出。此外,月之暗面正与IDG Capital等机构洽谈新一轮数亿美元融资,估值达40亿美元,并计划年底前完成融资,明年下半年启动IPO进程。
灵感Phoenix
11-27 16:43:04
RL训练加速
Seer引擎
月之暗面
分享至
打开微信扫一扫
内容投诉
生成图片
月之暗面或启动新一轮融资 估值将达40亿美元
【2025年11月21日】据《科创板日报》报道,大模型创企月之暗面(Moonshot AI)即将完成新一轮美元融资,估值有望达40亿美元。意向投资方包括IDG资本、腾讯等知名机构,融资金额可能达数亿美元。此外,月之暗面计划于明年启动IPO,进一步拓展其在人工智能领域的布局。这一融资进展显示出市场对大模型技术的持续关注与信心。(记者 李明明)
代码编织者Nexus
11-21 21:44:55
估值
月之暗面
融资
分享至
打开微信扫一扫
内容投诉
生成图片
K2 Thinking横空出世引热议:月之暗面高管亲自回应技术、效率与成本问题
11月13日,人工智能初创公司月之暗面(Moonshot AI)高管在Reddit举办AMA活动,回应Kimi K2 Thinking相关热点问题。K2 Thinking被描述为“迄今能力最强的开源思考模型”。高管杨植麟解释其长推理链得益于训练方式和INT4支持,并提到Turbo API将进一步提升速度。周昕宇称选择INT4是为兼容非Blackwell GPU,而吴育昕强调团队高效利用有限硬件资源。针对网友质疑K2 Thinking代币效率低及HLE测试表现,杨植麟表示优先性能而非效率,未来将改进通用能力。关于培训成本仅460万美元的说法,杨植麟否认并称难以量化。周昕宇透露新架构KDA提高效率,可能应用于K3模型,且调侃将在“萨姆价值万亿美元数据中心建成前”推出K3。此外,公司无AI浏览器计划,但正开发视觉-语言模型。
Journeyman
11-13 00:31:59
K2 Thinking
人工智能
月之暗面
分享至
打开微信扫一扫
内容投诉
生成图片
月之暗面杨植麟、周昕宇、吴育昕罕见回应一切:打假 460 万美元、调侃 OpenAI
11月12日,月之暗面团队在Reddit举行AMA活动,联合创始人杨植麟等人回应热点议题。针对Kimi K2 Thinking模型训练成本仅460万美元的传言,杨植麟澄清非官方数据,并透露正研究其视觉-语言版本。团队还解释了推理长度过长等问题,称优先考虑性能,未来将优化token效率。此外,月之暗面开源混合线性注意力架构Kimi Linear,其技术或用于K3模型。谈及开源安全性,杨植麟强调开放对齐技术栈的重要性。团队还调侃OpenAI,表示不计划开发AI浏览器,专注模型训练。最后,他们回应上下文窗口扩展计划,未来可能支持更长上下文,展现了中国AI创新能力的全球认可。
E-Poet
11-12 09:56:27
Kimi K2 Thinking
开源
月之暗面
分享至
打开微信扫一扫
内容投诉
生成图片
月之暗面否认Kimi K2 Thinking模型训练成本为460万美元
11月11日,月之暗面联合创始人兼CEO杨植麟在凌晨的社区活动中否认了Kimi K2 Thinking模型训练成本为460万美元的报道。他表示,该数字并非官方数据,且训练成本难以量化,因包含大量研究与实验投入。此外,杨植麟透露,Kimi K3模型将在萨姆·奥尔特曼的万亿美元数据中心建成前推出,进一步展示了公司在AI领域的研发进展与规划。
智能维度跳跃
11-11 16:19:11
Kimi K2 Thinking
月之暗面
训练成本
分享至
打开微信扫一扫
内容投诉
生成图片
月之暗面 Kimi K2 Thinking 训练成本被曝仅 460 万美元,性能超越数十亿美元投入的 OpenAI GPT 模型
11月8日,月之暗面推出开源思考模型Kimi K2 Thinking,性能超越GPT-5、Grok-4等先进模型,在人类终极考试中取得44.9%的优异成绩。该模型训练成本仅460万美元,远低于OpenAI数十亿美元的研发投入。与市场上许多闭源模型不同,Kimi K2 Thinking采用开源策略,发布模型权重、训练脚本及评估工具链,并允许商用,大幅降低开发者使用门槛,推动AI技术普及。
AI创想团
11-08 15:49:04
Kimi K2 Thinking
开源模型
月之暗面
分享至
打开微信扫一扫
内容投诉
生成图片
Kimi 迄今能力最强开源思考模型,月之暗面 Kimi K2 Thinking 发布
11月6日,月之暗面发布Kimi迄今能力最强的开源思考模型——Kimi K2 Thinking。该模型基于“模型即Agent”理念,具备自主工具调用和多轮思考能力,在多项基准测试中达到SOTA水平,如“人类最后的考试”中取得44.9%的成绩,BrowseComp网络浏览测试中以60.2%超越人类平均29.2%的表现。其支持复杂搜索、推理、编程及写作任务,能通过上百轮动态循环解决开放式问题。此外,模型在创意写作、学术研究和个人情感回应等方面均有显著提升,展现更强的逻辑性、同理心和表现力。模型已开源,可通过Hugging Face和ModelScope获取。
WisdomTrail
11-07 00:21:43
Kimi K2 Thinking
开源思考模型
月之暗面
分享至
打开微信扫一扫
内容投诉
生成图片
月之暗面将完成数亿美元融资
《科创板日报》记者李明明获悉,大模型Kimi的母公司月之暗面近期将完成一轮数亿美元的新融资。这一消息表明,月之暗面在人工智能领域的技术实力和发展潜力备受资本青睐。此轮融资的达成将进一步助力公司在大模型研发与应用方面的布局,为未来的技术创新和市场拓展奠定基础。随着资本的注入,月之暗面有望加速推动AI技术的商业化进程,持续巩固行业领先地位。
DreamCoder
10-24 10:36:59
大模型kimi
月之暗面
融资
分享至
打开微信扫一扫
内容投诉
生成图片
月之暗面 Kimi K2 宣布更新:上下文长度扩展至 256K,带来更快的 API
9月5日,月之暗面发布Kimi K2模型最新版本(0905),上下文长度扩展至256K,显著提升复杂任务支持能力。新版本在真实编程任务中表现更优,尤其Agentic Coding能力和前端编程体验均有升级。同时推出高速版API,输出速度达60-100 Token/s,并新增多项功能:Token Enforcer确保格式正确、兼容Anthropic API、支持WebSearch Tool和全自动Context Caching。定价与0711版相同,用户可通过Kimi开放平台或Hugging Face、ModelScope部署模型。
星际Code流浪者
09-05 12:17:23
Kimi K2
上下文长度
月之暗面
分享至
打开微信扫一扫
内容投诉
生成图片
月之暗面发布 Kimi K2 高速版:输出速度提升至每秒 40 Tokens
8月1日,月之暗面发布Kimi K2高速版(Kimi-K2-turbo-preview),输出速度从每秒10 Tokens提升至40 Tokens。新版本限时5折优惠,9月1日恢复原价,折扣后价格为:输入缓存命中2元/百万tokens,未命中8元,输出32元。Kimi K2模型于7月11日推出,支持最长128K上下文,具备更强通用性与工具调用能力,原API计费为输入4元/百万tokens,输出16元/百万tokens。
超频思维站
08-01 15:06:32
Kimi K2
月之暗面
输出速度
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序