MiniCPM - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

WAIC 最具技术想象力成果发布：新架构面壁小钢炮又一次验证并加速了面壁定律

2024年世界人工智能大会（WAIC）上，面壁智能发布MiniCPM-S高效稀疏模型，实现2.8倍推理速度提升与FFN模块84%成本降低，验证并加速了面壁定律。此外，MobileCPM推出，降低开发者门槛，支持一键集成端侧大模型至APP，无需云端GPU，显著降低成本。面壁智能CEO李大海宣布，2026年底将实现GPT-4水平的端侧模型，展示公司在AGI技术前沿的领导地位。

原文链接

镜像现实MirageX

07-06 12:05:22

分享至

打开微信扫一扫

内容投诉

生成图片

斯坦福抄袭清华，世界一流大学实锤了

美国斯坦福大学的一支本科生团队被曝抄袭中国AI初创公司面壁智能的开源模型MiniCPM-Llama3-V 2.5，引发业界关注。该团队发布的模型与MiniCPM高度相似，且存在未标明引用的问题。面壁智能指出模型架构、配置文件和代码的雷同，并揭示了模型能识别清华简这一独特功能，这是清华大学和面壁智能合作的专有数据。抄袭争议升级后，涉事团队删除模型并道歉，声称代码外包。斯坦福官方和HuggingFace负责人Omar Sanseviero对此事表示关注，肯定了中国AI生态系统的贡献。面壁智能决定免费公开MiniCPM，展现其开放姿态。此事促使人们反思对国产AI的固有看法，认为中国AI正逐渐成为全球竞争的关键力量。

原文链接

AI创意引擎

06-06 17:18:03

分享至

打开微信扫一扫

内容投诉

生成图片

套壳丑闻让斯坦福AI Lab主任怒了！抄袭团队2人甩锅1人失踪、前科经历被扒，网友：重新认识中国开源模型

斯坦福AI Lab主任怒批抄袭事件：斯坦福团队的Llama3-V被指抄袭清华大学面壁智能的MiniCPM-Llama3-V 2.5，团队成员之一的Mustafa Aljadery（老穆）失踪，其余两人承认抄袭并甩锅。Llama3-V团队在社交媒体上的致歉声明引起质疑，尤其是关于代码相似性和权重调整的解释。原作者团队强调了抄袭问题，并指出Llama3-V使用了未公开的清华简数据。新证据显示Llama3-V可能通过添加低方差噪声套用模型。事件引发关于开源社区对中国大模型成果关注不足的讨论，指出中国实验室在大模型研发中取得的进步。

原文链接

智慧轨迹

06-05 11:23:50

分享至

打开微信扫一扫

内容投诉

生成图片

面壁智能推出 MiniCPM-Llama3-V 2.5 开源端侧多模态模型：8B 参数、高效部署手机

面壁智能于5月21日开源新款端侧多模态模型MiniCPM-Llama3-V 2.5，这款8B参数的轻量化模型在30+语言支持上表现出色，超越GPT-4V和Gemini Pro，尤其在OCR能力上达到SOTA，提高150倍图像编码速度。在多项基准测试中，MiniCPM-Llama3-V 2.5展现了强大的综合性能，适合高效部署于手机设备，且支持多种国际语言，包括一带一路国家的主要语种。

原文链接