1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
实测美团 LongCat:快到极致,但是别说追平 DeepSeek
2025年9月5日,美团推出的开源大模型LongCat-Flash-Chat因“快如闪电”的响应速度引发关注,尤其在轻量问答场景中表现惊艳。然而,实测显示其推理能力存在明显短板,复杂问题回答时逻辑混乱、重点模糊,与DeepSeek-V3.1相比差距显著。DeepSeek在逻辑拆解和因果推理上表现更稳健,答案条理清晰且可信赖。实测表明,LongCat在速度上领先,单用户生成速度超100 tokens/秒,但推理场景下短板暴露无遗。行业观点认为,速度虽能带来短期惊艳,但逻辑才是模型赢得用户信任的关键。作为美团首款开源模型,LongCat在交互体验上有突破,但在高价值场景中仍有提升空间。
跨界思维
09-05 15:22:48
DeepSeek-V3.1
LongCat-Flash-Chat
速度与逻辑
分享至
打开微信扫一扫
内容投诉
生成图片
AI生成苹果Metal内核,PyTorch推理速度提升87%
2025年9月,Gimlet Labs研究发现,AI可自动生成苹果设备的Metal内核,并显著提升PyTorch推理速度。实验显示,AI生成内核在215个PyTorch模块上实现平均1.87倍加速,部分工作负载甚至快数百倍。研究人员使用Mac Studio(Apple M4 Max芯片)和PyTorch eager模式作为基准,测试了Anthropic、DeepSeek和OpenAI等模型。AI生成内核正确性随尝试次数增加而提高,第5次尝试时可达94%。智能体群体策略进一步优化性能,平均加速31%,特定层级达42%。研究强调其目标是验证AI生成内核的可行性,而非追求极限性能,展现自动化内核工程的潜力。
数据炼金师
09-05 11:17:03
AI生成内核
Metal性能优化
PyTorch推理速度
分享至
打开微信扫一扫
内容投诉
生成图片
Kimi K2 高速版 AI 模型提速,输出速度最高可达每秒 100 Tokens
8月22日,月之暗面宣布其Kimi K2高速版AI模型输出速度提升至每秒60 Tokens,最高可达每秒100 Tokens。该模型目前享受5折优惠,输入价格(缓存命中)为¥2.00/百万tokens,输出价格为¥32.00/百万tokens,9月1日将恢复原价。Kimi K2高速版于8月1日发布,持续优化性能,为用户提供更高效的AI服务。
量子思考者
08-22 16:51:22
AI模型
Kimi K2
输出速度
分享至
打开微信扫一扫
内容投诉
生成图片
支持消费级显卡部署:腾讯混元 3D 世界模型宣布推出 Lite 版本,推理速度提升 3 倍以上且精度损失 <1%
8月15日,腾讯混元团队宣布推出3D世界模型1.0的Lite版本,通过动态FP8量化技术将显存需求从26GB降至17GB以下,成功适配消费级显卡。新版推理速度提升3倍以上,精度损失小于1%,并集成Cache算法优化冗余时间步,显著提升效率。该模型支持文字或图片输入生成高质量、可编辑的360度漫游场景,并可导出为3D mesh格式文件,适用于游戏开发、影视制作等领域。作为业界首个开源可编辑世界生成模型,其降低了3D内容创作门槛,解决了此前显存占用过高的问题,让更多中小企业和个人开发者能够便捷使用。官方地址已开放,包括官网、GitHub及Hugging Face等平台。
AI创意引擎
08-15 19:20:35
推理速度
消费级显卡
腾讯混元3D世界模型
分享至
打开微信扫一扫
内容投诉
生成图片
月之暗面发布 Kimi K2 高速版:输出速度提升至每秒 40 Tokens
8月1日,月之暗面发布Kimi K2高速版(Kimi-K2-turbo-preview),输出速度从每秒10 Tokens提升至40 Tokens。新版本限时5折优惠,9月1日恢复原价,折扣后价格为:输入缓存命中2元/百万tokens,未命中8元,输出32元。Kimi K2模型于7月11日推出,支持最长128K上下文,具备更强通用性与工具调用能力,原API计费为输入4元/百万tokens,输出16元/百万tokens。
超频思维站
08-01 15:06:32
Kimi K2
月之暗面
输出速度
分享至
打开微信扫一扫
内容投诉
生成图片
字节跳动Seed团队发布扩散语言模型 每秒推理速度2146 tokens
7月31日,字节跳动Seed团队发布实验性扩散语言模型Seed Diffusion Preview。该模型以结构化代码生成为实验领域,旨在验证离散扩散技术作为下一代语言模型基础框架的可行性。实验数据显示,其代码推理速度达2146 tokens/s,比同等规模的自回归模型快5.4倍。这一成果展示了扩散模型在语言生成领域的潜力,为未来技术发展提供了新方向。
月光编码师
08-01 09:24:01
字节跳动
扩散语言模型
推理速度
分享至
打开微信扫一扫
内容投诉
生成图片
5个月狂赚4000万美金,一家公司的绝地求生|AI原生100
2024年10月,AI编程助手Bolt.new悄然上线,仅5个月年收入达4000万美元,注册用户超300万,月活超100万。其母公司StackBlitz曾因技术无应用场景濒临倒闭,后全力投入Bolt.new开发,凭借自然语言生成完整应用的功能迅速崛起。产品面向零基础用户,简化开发环境搭建,背后依托Anthropic的Claude模型。2025年初,Bolt.new完成1.055亿美元B轮融资,估值猛增。尽管面临大厂和友商竞争,其‘让复杂变简单’的定位使其成为增长最快的软件产品之一。
AI创想团
07-18 10:37:37
AI编程
Bolt.new
增长速度
分享至
打开微信扫一扫
内容投诉
生成图片
月之暗面回应 Kimi K2 模型 API 速度慢:正在优化推理效率,也在加卡加机器
7月15日,月之暗面回应Kimi K2模型API速度慢问题,称主要原因是访问量大和模型体积大,目前正全力优化推理效率并增加硬件资源,预计几天内速度将明显提升。Kimi K2模型于7月11日正式发布,支持最长128K上下文,具备更强通用性与工具调用能力,API服务已全面上线。计费方案为每百万输入tokens 4元、每百万输出tokens 16元。此外,Kimi K2完全开源,用户可通过其他供应商接入或自行部署。
LunarCoder
07-15 20:49:00
API 速度优化
Kimi K2 模型
月之暗面
分享至
打开微信扫一扫
内容投诉
生成图片
月之暗面回应Kimi K2模型API速度慢:正在解决中 也在加卡加机器
7月15日晚间,月之暗面发布公告回应Kimi K2模型API速度慢的问题,称目前正在全力解决。公司表示,问题主要源于访问量大和模型体积大的双重压力,正在通过优化推理效率、增加硬件设备提升性能。预计未来几天内,API速度将得到明显改善。
Oasis
07-15 19:48:46
API速度
Kimi K2模型
月之暗面
分享至
打开微信扫一扫
内容投诉
生成图片
估值百亿的AI独角兽,都有哪些特质?
估值百亿的AI独角兽,都有哪些特质? ChatGPT引爆全球AI热潮后,投资界重新审视AI赛道的价值与风险。红杉资本将2024年比作“原始汤”阶段,认为这是“想法爆发期”,而2025年将是这些想法落地的关键年。a16z更预测,AI可能成为人类历史上最大投资机会,到2027年创造1.16万亿美元价值。...
LunarCoder
07-14 18:27:41
AI独角兽
过程数据
速度护城河
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序