1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:大模型热度退潮,真正的技术创新者开始被「看见」

“过去两年中国的大模型投资更多是投商业模式,而非技术本身。硅谷的投资人更倾向于押注技术突破。”一位投资人对AI科技评论表示。

相较于商业模式驱动的投资,技术投资更看重持续创新的高度。在DeepSeek扬名之前,追随OpenAI成为吸金焦点;而今,“独立创新”已成主流。

融资热度虽有所下降,但行业正朝健康方向发展。截至2025年6月,智谱AI与专注端侧AI的面壁智能宣布了新一轮融资。裸泳者退出,装备齐全者登场。

DeepSeek开创云上千亿级大模型先河,推动所有公司直面技术创新。同样注重基础技术革新的团队也开始崭露头角,面壁智能就是其中之一。其新一代“小钢炮4.0”展示了端侧推理与架构创新的潜力。

AGI落地正向云端及终端双向发展。DeepSeek与面壁智能各领风骚,分别聚焦云上应用与终端智能。在架构与推理上的创新尤为关键,面壁通过InfLLM v2稀疏注意力结构大幅提升端侧效率。

MiniCPM 4.0不仅在数据、学习、推理与架构四方面优化,还大幅减少层数,提升效率。其创新的“稀疏注意力”模式让模型在长短文本场景间灵活切换。此外,CPM.cu推理框架、BitCPM量化算法与ArkInfer跨平台部署框架进一步增强了性能。

面壁团队通过底层优化、数据筛选与高效训练策略,使MiniCPM 4.0在多个维度超越同行。从数据采集到模型训练,每一步都力求最优。而风洞2.0方案更将实验次数削减一半。

DeepSeek的成功证明了多样化创新的可能性。而面壁的故事则展现了如何在有限资源下追求效率最优,为领域持续贡献力量。这表明,端侧探索可能是通往通用智能的重要答案。

原文链接
本文链接:https://kx.umi6.com/article/20542.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
最新一期权威大模型榜单:豆包1.5、商汤日日新V6并列国内第一
2025-05-30 16:55:41
人工智能的新浪潮和商业化
2025-06-09 19:31:59
统计可控数据合成!新框架突破大模型数据生成局限,麦吉尔大学团队推出LLMSynthor
2025-05-25 15:17:36
24小时热文
更多
扫一扫体验小程序