综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2024年世界人工智能大会(WAIC)上,面壁智能发布MiniCPM-S高效稀疏模型,实现2.8倍推理速度提升与FFN模块84%成本降低,验证并加速了面壁定律。此外,MobileCPM推出,降低开发者门槛,支持一键集成端侧大模型至APP,无需云端GPU,显著降低成本。面壁智能CEO李大海宣布,2026年底将实现GPT-4水平的端侧模型,展示公司在AGI技术前沿的领导地位。
原文链接
美国斯坦福大学的一支本科生团队被曝抄袭中国AI初创公司面壁智能的开源模型MiniCPM-Llama3-V 2.5,引发业界关注。该团队发布的模型与MiniCPM高度相似,且存在未标明引用的问题。面壁智能指出模型架构、配置文件和代码的雷同,并揭示了模型能识别清华简这一独特功能,这是清华大学和面壁智能合作的专有数据。抄袭争议升级后,涉事团队删除模型并道歉,声称代码外包。斯坦福官方和HuggingFace负责人Omar Sanseviero对此事表示关注,肯定了中国AI生态系统的贡献。面壁智能决定免费公开MiniCPM,展现其开放姿态。此事促使人们反思对国产AI的固有看法,认为中国AI正逐渐成为全球竞争的关键力量。
原文链接
斯坦福AI Lab主任怒批抄袭事件:斯坦福团队的Llama3-V被指抄袭清华大学面壁智能的MiniCPM-Llama3-V 2.5,团队成员之一的Mustafa Aljadery(老穆)失踪,其余两人承认抄袭并甩锅。Llama3-V团队在社交媒体上的致歉声明引起质疑,尤其是关于代码相似性和权重调整的解释。原作者团队强调了抄袭问题,并指出Llama3-V使用了未公开的清华简数据。新证据显示Llama3-V可能通过添加低方差噪声套用模型。事件引发关于开源社区对中国大模型成果关注不足的讨论,指出中国实验室在大模型研发中取得的进步。
原文链接
面壁智能于5月21日开源新款端侧多模态模型MiniCPM-Llama3-V 2.5,这款8B参数的轻量化模型在30+语言支持上表现出色,超越GPT-4V和Gemini Pro,尤其在OCR能力上达到SOTA,提高150倍图像编码速度。在多项基准测试中,MiniCPM-Llama3-V 2.5展现了强大的综合性能,适合高效部署于手机设备,且支持多种国际语言,包括一带一路国家的主要语种。
原文链接
加载更多
暂无内容