1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

OpenAI发布GPT-4o mini,中国大模型紧随其后

美国时间7月18日,OpenAI宣布发布多模态小模型GPT-4o mini,引起广泛关注。尽管GPT-3奠定了AI模型的"暴力美学"时代,GPT-4o mini的发布标志着OpenAI开始聚焦于"小模型"领域。值得注意的是,欧洲和中国的大模型团队已在小模型研究上领先大半年。

自2023年智谱AI发布对话小模型ChatGLM-6B、Mistral在10月推出7B模型,至2024年面壁智能团队发布2.4B的MiniCPM,多模态小模型如8B MiniCPM-Llama3-V 2.5、商汤的1.8B SenseChat Lite、上海人工智能实验室的Intern-VL系列相继问世。这表明基于通用大模型开发小模型已成为国内研究热点。

Andrej Karpathy认为未来将出现参数规模小但思考能力强的小模型,这是AI“大模型”的最终目标。他指出,当前AI模型规模庞大主要是由于训练效率低下,面壁智能团队也持有相似观点。如何让小模型更智能的关键在于增加训练数据,通过先做大模型再做小模型的方式,利用大模型的高质量数据进行重构。

面壁智能团队自2023年下半年开始,通过建立“大模型训练小模型”的沙盒实验机制,验证了模型参数规模随时间递减、智能水平上升的“面壁定律”。这表明在小规模上实现更高智能将大幅降低训练与推理成本,但这也对算法与数据工程构成巨大挑战。

GPT-4o mini在文本智能和多模态推理方面表现出色,支持多种语言和输入输出格式,成本低于GPT-3.5 Turbo。这使得OpenAI在小模型市场中寻求立足之地,为开发者提供更经济的工具。

然而,国外用户对GPT-4o mini的反馈褒贬不一,部分用户期待更好的版本,对GPT-4.5及GPT-5表现出更高热情。国内大模型团队如商汤、面壁智能等在文本和多模态小模型上展现出卓越能力,如商汤的SenseChat-Lite版本和面壁智能的MiniCPM系列。

OpenAI退出中国市场后,对国内模型团队影响有限,面壁智能等团队通过在小模型上的努力,展示了国产大模型的竞争力。国产小模型不仅在功能上不逊于OpenAI,而且在成本和实用性方面具有优势。

小模型的兴起推动了计算成本更低的AI模型应用于终端硬件,促进了端侧模型的兴起。端侧模型的研发需要结合模型、硬件与计算,成本问题成为制约因素,尤其是对于非高端行业。小模型的开源社区也促使更多高校科研人员参与到大模型研究中。

整体而言,OpenAI的GPT-4o mini发布标志着小模型研究的风向标,中国大模型团队的快速跟进体现了技术创新和竞争的激烈程度。面对未来,国产大模型将继续在小模型领域展现实力,推动行业进步。

原文链接
本文链接:https://kx.umi6.com/article/4463.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
汇丰银行:OpenAI 到 2030 年都难以盈利,同时还要再砸至少 2070 亿美元
2025-11-27 15:43:07
AI投资进入「下半场」
2025-11-13 15:03:01
Intel首席技术、AI官突然跳槽OpenAI!印度裔天才
2025-11-11 12:06:42
加量不加价:OpenAI 最强编程 AI 模型 API 开放,连续写代码可超 24 小时
2025-12-05 14:33:49
AI领域“强强联手”:OpenAI与富士康达成合作,在美生产新兴硬件!
2025-11-21 10:14:21
坦白从宽:OpenAI 开发新系统教导模型诚实承认自身“不良行为”
2025-12-04 17:36:30
AI的两种“玩法”:三年后OpenAI还在烧钱 Anthropic将开始赚钱?
2025-11-11 15:11:53
微软自研AI芯片遇阻:计划借力OpenAI技术实现突围
2025-11-13 09:52:43
OpenAI 在德国吃官司:ChatGPT 未经许可使用歌词属于侵权行为
2025-11-11 18:22:32
OpenAI合纵亚马逊,微软连横Anthropic,硅谷只有利益没有盟友
2025-11-05 15:08:25
OpenAI开始变得俗气了
2025-11-15 16:58:14
鸿海科技宣布与 OpenAI 达成合作,推动下一代 AI 基础设施硬件的设计及美国制造
2025-11-21 08:05:52
AI 聊天机器人 ChatGPT 今天突发故障,OpenAI 已紧急修复
2025-12-03 09:11:44
24小时热文
更多
扫一扫体验小程序