1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:大模型热度退潮,真正的技术创新者开始被「看见」

“过去两年中国的大模型投资更多是投商业模式,而非技术本身。硅谷的投资人更倾向于押注技术突破。”一位投资人对AI科技评论表示。

相较于商业模式驱动的投资,技术投资更看重持续创新的高度。在DeepSeek扬名之前,追随OpenAI成为吸金焦点;而今,“独立创新”已成主流。

融资热度虽有所下降,但行业正朝健康方向发展。截至2025年6月,智谱AI与专注端侧AI的面壁智能宣布了新一轮融资。裸泳者退出,装备齐全者登场。

DeepSeek开创云上千亿级大模型先河,推动所有公司直面技术创新。同样注重基础技术革新的团队也开始崭露头角,面壁智能就是其中之一。其新一代“小钢炮4.0”展示了端侧推理与架构创新的潜力。

AGI落地正向云端及终端双向发展。DeepSeek与面壁智能各领风骚,分别聚焦云上应用与终端智能。在架构与推理上的创新尤为关键,面壁通过InfLLM v2稀疏注意力结构大幅提升端侧效率。

MiniCPM 4.0不仅在数据、学习、推理与架构四方面优化,还大幅减少层数,提升效率。其创新的“稀疏注意力”模式让模型在长短文本场景间灵活切换。此外,CPM.cu推理框架、BitCPM量化算法与ArkInfer跨平台部署框架进一步增强了性能。

面壁团队通过底层优化、数据筛选与高效训练策略,使MiniCPM 4.0在多个维度超越同行。从数据采集到模型训练,每一步都力求最优。而风洞2.0方案更将实验次数削减一半。

DeepSeek的成功证明了多样化创新的可能性。而面壁的故事则展现了如何在有限资源下追求效率最优,为领域持续贡献力量。这表明,端侧探索可能是通往通用智能的重要答案。

原文链接
本文链接:https://kx.umi6.com/article/20542.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
GPT-5能让普通人变成博士,但魔法依旧没有
2025-08-08 12:10:14
一场「狼人杀」,考倒了一堆大模型
2025-08-28 14:28:50
vivo发布端侧多模态模型,只有3B可理解GUI界面,20项评测表现亮眼
2025-07-10 17:25:30
GPT-5 没有惊喜,但信号拉满
2025-08-11 13:00:45
李飞飞的答案:大模型之后,Agent向何处去?
2025-09-05 09:13:59
一场对抗OpenAI们的“危险游戏”,值不值得投资
2025-07-23 08:46:29
关于 AI Infra 的一切
2025-08-11 19:08:22
真正的AI竞争力,藏在大模型“后训练”这一步
2025-10-13 16:59:55
阿里、智谱等扎堆发布大模型 编程、金融等方向成焦点
2025-07-30 20:55:52
字节跳动、阿里AI“大将”出走
2025-08-25 22:35:04
大模型自信心崩塌!谷歌DeepMind证实:反对意见让GPT-4o轻易放弃正确答案
2025-07-20 16:05:44
英伟达新研究:小模型才是智能体的未来
2025-08-19 08:54:39
大厂「AI」智能体,等待 DeepSeek 时刻
2025-07-31 11:05:08
24小时热文
更多
扫一扫体验小程序