
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
OpenAI发布了新的聊天模型GPT-4.5,尽管有人认为它像真人交流,但其逻辑推理能力一般,且在数理能力上表现不佳。GPT-4.5在多项基准测试中不如o3-mini,且价格昂贵,每百万Tokens价格高达75美元,比GPT-4o高出30倍。此外,GPT-4.5在处理任务时速度慢,生成SVG图片需112秒。然而,它在语言理解和创作方面表现出色,被认为适合写作和设计创意。OpenAI计划通过强化学习进一步提升其性能。发布时间:近日
原文链接
财联社2月8日电,OpenAI CEO山姆·奥特曼2月7日在柏林工业大学表示,即将推出的GPT-5不仅比他本人更聪明,还将超越所有人类的智力水平,成为“疯狂的高智商工具”。
原文链接
OpenAI CEO Sam Altman表示,AI的“智商”在过去几年中迅速提升,但他也承认这不是科学准确的说法。许多专家认为,用智商测试衡量AI能力是不合适的,因为智商测试是基于人类智力设计的,而AI和人类解决问题的方式不同。牛津大学研究员Sandra Wachter指出,将AI的能力与人类智力相比,就像比较苹果和橘子。AI在智商测试中的优势部分源于其巨大的内存和内化知识。伦敦国王学院研究员Mike Cook提到,AI通过大量练习测试来提高成绩,这与人类的学习方式不同。AI Now研究所的Heidy Khlaaf强调,我们需要更合适的方法来评估AI的能力。
原文链接
一觉醒来,发现AI的智商比肩爱因斯坦。OpenAI新模型o3在Codeforces上的评分达2727,换算成人脑智商约为157,远超普通人类。短短7个月内,从GPT-4o到o3,AI智商飙升42分。
尽管AI表现惊人,但用人类智商测试来衡量并不恰当。传统智商测试基于人类特有的思维模式,涵盖逻辑推理、...
原文链接
OpenAI的o3模型在Codeforces上获得2727分,相当于智商157,超过99.8%的程序员。这一成绩远超爱因斯坦的估计智商160。o3仅用7个月就提升了42分,而人类需约140年才能达到同样的进步。o3在AIME 2024数学竞赛中得96.7分,远超GPT-4o的13.4分。尽管o3仍处于安全测试阶段,未来AI的发展可能将彻底改变教育和科研领域。
原文链接
数千元AI学习机:是智商税还是教育助手?
随着AI算法的快速发展,AI学习机成为家长热议的话题。各大教育硬件企业、转型期教培企业和科技公司纷纷推出结合大模型技术的学习机新品,市场热度显著提升。AI学习机的普及让家长们对其效能产生了浓厚兴趣,尤其是在面对孩子学习压力和自身忙碌的情况下。
市场概览与功能...
原文链接
【中国五连冠终结,美国队重登IMO宝座】在第65届国际数学奥林匹克竞赛(IMO)中,美国队以192分的成绩逆袭,夺得冠军,领先中国队两分,终结了中国连续五年的冠军记录。这是自2016年以来,美国队首次问鼎IMO。中国和美国队均表现出色,各自拿下5枚金牌和1枚银牌。
【AI智商被第一题打回原形】在本...
原文链接
在2024世界人工智能大会上,百度创始人李彦宏和猎豹移动CEO傅盛围绕开源与闭源大模型展开了辩论。李彦宏认为开源模型是“智商税”,强调闭源模型如ChatGPT和文心一言的性能优势及推理成本低。傅盛则持相反观点,认为两者应相互竞争,但付费闭源大模型才是真正的“智商税”。尽管李彦宏提到开源模型在学术研究中有价值,但傅盛强调结合企业实际应用的重要性。AI领域报告显示,2023年65.7%的模型为开源,闭源模型在性能上通常优于开源。专家认为,选择模型的关键在于根据实际需求和长远考虑,包括成本、安全和社区发展,开源与闭源应作为AI生态系统中的互补策略。
原文链接
图灵测试2.0:判断AI能力的关键标准
图灵测试最初是定性概念,但应用于产品时,它决定AI产品的实际效能。新的2.0版本聚焦于角色中心的AI计算,即AI能否处理角色内的所有任务,如招聘中的需求匹配和候选人评估,若AI能无缝执行这些任务,且人类难以分辨其真人或AI,即视为通过图灵测试2.0。
举个例子...
原文链接
今日(6月10日),#AI预测宝宝长相是不是智商税#话题登上微博热搜,引发关注。电商平台上低至6.8元的AI服务可生成四维彩超照片,据人工智能专家郭涛指出,虽然AI能处理图像,但受多种因素影响,胎儿成长难以精确预测。柏文喜认为,这类服务主要作为娱乐手段,满足宝爸宝妈的好奇心,但不可过度依赖。微信上充斥着声称能预测宝宝长相的小程序,价格低廉但评分普遍较低,表明消费者对其准确性存疑。
原文链接
加载更多

暂无内容