
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
4月15日,OpenAI宣布将于7月14日起停止通过API提供GPT-4.5模型,该模型于2月发布。开发者可继续使用GPT-4.5至7月14日,之后需转向其他模型。OpenAI推出新模型GPT-4.1,其性能与GPT-4.5相当或更优,且成本更低。GPT-4.5仅限API层面调整,ChatGPT平台的付费用户仍可使用。GPT-4.5训练投入巨大,但在部分基准测试中未达前沿水平,高昂的运行成本是停用的主要原因,其定价为每百万输入token 75美元,输出token 150美元,为OpenAI最贵产品之一。
原文链接
4月13日消息,OpenAI首次披露GPT-4.5研发细节,该项目耗时远超预期,涉及10万块GPU,几乎全员参与。过程中遭遇多次“灾难性问题”,如隐藏bug导致训练进度过40%才被发现。尽管如此,团队最终打造出性能提升约10倍的模型,展现全方位增强的智能。OpenAI指出,未来性能提升的关键在于数据效率,而非单纯依赖算力。目前,系统正从单集群转向多集群架构,未来可能涉及1000万块GPU协作。此外,OpenAI强调紧密的机器学习与系统团队合作,以及对异常零容忍的态度,使项目得以推进。GPT-4.5的研发经验揭示了数据长尾效应和Scaling Law的重要性,同时展望了去中心化训练的可能性。
原文链接
据《科创板日报》3日报道,美国加州大学圣地亚哥分校的研究团队宣布,他们首次证明了人工智能系统可通过标准的三方图灵测试。本次研究选取了GPT-4.5、LLaMa-3.1-405B、GPT-4o及ELIZA四种AI系统参与测试。在实验中,裁判需在与两名人类和一个AI系统的对话后,判断谁是人类。结果显示,GPT-4.5被误认为人类的比例达73%,远超真实人类参与者被识别出的概率。这项研究为AI技术的进步提供了重要参考,引发广泛关注。
原文链接
4月2日,加州大学圣地亚哥分校的研究成果显示,AI模型GPT-4.5和Llama 3.1-405B首次通过了标准三方图灵测试。图灵测试由阿兰·图灵于1950年提出,要求提问者在与人类和机器对话后无法准确区分哪一方是人类。研究中,三种AI模型参与测试,包括GPT-4.5、Llama 3.1-405B和GPT-4o。在PERSONA模式下,GPT-4.5的胜率为73%,Llama 3.1-405B胜率为56%;而GPT-4o在NO-PERSONA模式下的胜率仅为21%。测试对话以日常闲聊为主,涉及生活细节和社会情感讨论。研究认为,通过图灵测试的AI系统可能在多种社交场景中替代人类,包括工作交流及私人对话。
原文链接
OpenAI于2月28日推出GPT-4.5 AI模型,现已提前向ChatGPT Plus用户开放。GPT-4.5交互更自然,知识库更广,理解用户意图和“情商”更高。该模型将依次扩展至Plus、Team、Enterprise和Edu用户。同时,微软Azure AI Foundry平台将同步上线GPT-4.5。OpenAI计划于5月底前推出GPT-5,逐步停用o3模型。值得注意的是,GPT-4.5的价格远高于GPT-4o,其输入和输出费用分别是GPT-4o的30倍和15倍。
原文链接
OpenAI于2月28日推出了GPT-4.5 AI模型,号称交互更自然、知识库更广且能更好地理解用户意图。该模型采用全新监督技术减少幻觉现象,并在微软Azure AI超级计算机上训练。目前,GPT-4.5已向Pro用户开放,预计下周将扩展至Plus和Team用户,后续还将向Enterprise与Edu用户开放。此外,GPT-4.5将在微软Azure AI Foundry平台与Stability AI及Cohere的模型共同上线。另据The Verge报道,OpenAI计划于5月底前推出GPT-5,同时逐步停用o3模型并整合其功能。
原文链接
GPT-4.5刚登顶竞技场6小时后被马斯克的Grok-3以总分1412:1411逆袭,仅差一分。Grok-3在总体带风格控制和困难提示词带风格控制方面略胜一筹。DeepSeek-R1总分第六,数学和困难提示词带风格控制分项与GPT-4.5并列第一。有用户质疑6小时内的巨大变化,解释称这与投票门槛有关。GPT-4.5口碑逐渐改善,用户开始称赞其情商,并且有人请求官方承诺不会下架该模型。此外,GPT-4.5还在一个类似大模型狼人杀的另类榜单上表现出色,各方面均领先于人类。
原文链接
OpenAI的GPT-4.5刚登顶竞技场,6小时后就被xAI的Grok-3以1分优势反超,两者票数均为3000+,总分1412:1411。Grok-3在总体带风格控制、困难提示词带风格控制方面略逊于GPT-4.5。DeepSeek-R1总分第6,数学和困难提示词带风格控制与GPT-4.5并列第一。有用户质疑6小时内变化是否合理,解释称大模型竞技场有投票门槛。GPT-4.5口碑有所改善,用户开始称赞其情商。奥尔特曼表示收到邮件请求承诺不下架该模型,并分享了与GPT-4.5的对话记录。此外,GPT-4.5还在一个类似大模型狼人杀的另类榜单中表现出色。
原文链接
3月1日,科技媒体The Decoder报道,OpenAI最新模型GPT-4.5在性能提升有限(6.8%-13.2%)的情况下,成本却激增,输入tokens成本高出30倍,输出tokens成本高出15倍。GPT-4.5每百万tokens费用分别为输入75美元、输出150美元,而GPT-4o相应费用仅为2.5美元和10美元。OpenAI正评估GPT-4.5的长期提供可行性,并收集用户反馈。若GPT-4.5停止服务,依赖该模型的应用开发者将受影响。OpenAI可能推出GPT-4.5 Turbo版本降低成本,但效果待定。
原文链接
标题:万轮实测:GPT-4.5 不如 GPT-4
经过总计30291次盲测投票,大多数人更喜欢GPT-4。赛博菩萨Andrej Karpathy回顾了GPT系列的发展历史:GPT-1只能生成基本文本,GPT-2较为混乱,GPT-3更为有趣;GPT-3.5达到商用水平并引发“ChatGPT时刻”;GP...
原文链接
加载更多

暂无内容