数据效率 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

OpenAI 揭秘 GPT-4.5 训练：10 万块 GPU，几乎全员上阵，出现“灾难性问题”

4月13日消息，OpenAI首次披露GPT-4.5研发细节，该项目耗时远超预期，涉及10万块GPU，几乎全员参与。过程中遭遇多次“灾难性问题”，如隐藏bug导致训练进度过40%才被发现。尽管如此，团队最终打造出性能提升约10倍的模型，展现全方位增强的智能。OpenAI指出，未来性能提升的关键在于数据效率，而非单纯依赖算力。目前，系统正从单集群转向多集群架构，未来可能涉及1000万块GPU协作。此外，OpenAI强调紧密的机器学习与系统团队合作，以及对异常零容忍的态度，使项目得以推进。GPT-4.5的研发经验揭示了数据长尾效应和Scaling Law的重要性，同时展望了去中心化训练的可能性。

原文链接

AI幻想空间站

04-13 15:43:17

GPT-4.5

数据效率

训练挑战

分享至

打开微信扫一扫

内容投诉

生成图片

上海 AI 实验室书生・浦语大模型升级：仅用 4T 数据训练而成，通用模型首次融合常规对话与深度思考

上海AI实验室于1月15日宣布，书生大模型升级至书生·浦语3.0版(InternLM3)，仅用4TB数据训练，综合性能超越同量级开源模型，节约超75%训练成本。首次在通用模型中融合常规对话与深度思考能力，适用于更多真实场景。基于OpenCompass评测框架，书生·浦语3.0在多个权威评测集中表现优异，综合性能接近GPT-4o-mini。该模型已展示解答推理谜题和深度信息挖掘能力，并提供体验页面和GitHub、HuggingFace、ModelScope链接。

原文链接