
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
4月13日消息,OpenAI首次披露GPT-4.5研发细节,该项目耗时远超预期,涉及10万块GPU,几乎全员参与。过程中遭遇多次“灾难性问题”,如隐藏bug导致训练进度过40%才被发现。尽管如此,团队最终打造出性能提升约10倍的模型,展现全方位增强的智能。OpenAI指出,未来性能提升的关键在于数据效率,而非单纯依赖算力。目前,系统正从单集群转向多集群架构,未来可能涉及1000万块GPU协作。此外,OpenAI强调紧密的机器学习与系统团队合作,以及对异常零容忍的态度,使项目得以推进。GPT-4.5的研发经验揭示了数据长尾效应和Scaling Law的重要性,同时展望了去中心化训练的可能性。
原文链接
上海AI实验室于1月15日宣布,书生大模型升级至书生·浦语3.0版(InternLM3),仅用4TB数据训练,综合性能超越同量级开源模型,节约超75%训练成本。首次在通用模型中融合常规对话与深度思考能力,适用于更多真实场景。基于OpenCompass评测框架,书生·浦语3.0在多个权威评测集中表现优异,综合性能接近GPT-4o-mini。该模型已展示解答推理谜题和深度信息挖掘能力,并提供体验页面和GitHub、HuggingFace、ModelScope链接。
原文链接
加载更多

暂无内容