1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:大模型热度退潮,真正的技术创新者开始被「看见」

“过去两年中国的大模型投资更多是投商业模式,而非技术本身。硅谷的投资人更倾向于押注技术突破。”一位投资人对AI科技评论表示。

相较于商业模式驱动的投资,技术投资更看重持续创新的高度。在DeepSeek扬名之前,追随OpenAI成为吸金焦点;而今,“独立创新”已成主流。

融资热度虽有所下降,但行业正朝健康方向发展。截至2025年6月,智谱AI与专注端侧AI的面壁智能宣布了新一轮融资。裸泳者退出,装备齐全者登场。

DeepSeek开创云上千亿级大模型先河,推动所有公司直面技术创新。同样注重基础技术革新的团队也开始崭露头角,面壁智能就是其中之一。其新一代“小钢炮4.0”展示了端侧推理与架构创新的潜力。

AGI落地正向云端及终端双向发展。DeepSeek与面壁智能各领风骚,分别聚焦云上应用与终端智能。在架构与推理上的创新尤为关键,面壁通过InfLLM v2稀疏注意力结构大幅提升端侧效率。

MiniCPM 4.0不仅在数据、学习、推理与架构四方面优化,还大幅减少层数,提升效率。其创新的“稀疏注意力”模式让模型在长短文本场景间灵活切换。此外,CPM.cu推理框架、BitCPM量化算法与ArkInfer跨平台部署框架进一步增强了性能。

面壁团队通过底层优化、数据筛选与高效训练策略,使MiniCPM 4.0在多个维度超越同行。从数据采集到模型训练,每一步都力求最优。而风洞2.0方案更将实验次数削减一半。

DeepSeek的成功证明了多样化创新的可能性。而面壁的故事则展现了如何在有限资源下追求效率最优,为领域持续贡献力量。这表明,端侧探索可能是通往通用智能的重要答案。

原文链接
本文链接:https://kx.umi6.com/article/20542.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
李彦宏:百度下一代旗舰大模型研发中 会在准备就绪后尽快发布
2025-08-20 21:19:28
Scaling Law再遭质疑:“退化式AI”竟成终局?
2025-08-04 21:03:25
大模型首次直接理解代码图:不用Agent修bug,登顶SWE-Bench开源榜
2025-06-27 15:08:34
苹果AI掉队?现在唱衰或许还为时过早
2025-07-03 10:09:13
GPT-5 没有惊喜,但信号拉满
2025-08-11 13:00:45
我国大模型数量超1500个
2025-07-27 23:04:18
企业管理软件是不是和AI无关?
2025-06-23 13:23:28
国产大模型高考裸分683:选清华 还是北大
2025-06-27 17:18:09
大厂「AI」智能体,等待 DeepSeek 时刻
2025-07-31 11:05:08
独家,清华教授朱恒源:AI与创新,7个大问题
2025-08-03 11:37:18
vivo发布端侧多模态模型,只有3B可理解GUI界面,20项评测表现亮眼
2025-07-10 17:25:30
万字回顾首届中国AI算力大会!15+位大咖主会场演讲精华爆棚,来没来都值得收藏
2025-07-04 14:44:08
上海出台17条措施促进软信业发展 优质大模型应用最高给予30%补助
2025-07-07 20:36:05
24小时热文
更多
扫一扫体验小程序