
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
9月6日,OpenAI研究人员宣布破解大语言模型的“幻觉”难题,即模型输出不准确信息的问题。研究指出,幻觉源于训练方式偏向奖励猜测而非承认不确定性,导致模型倾向于‘装作知道’而非坦率表达未知。Claude模型因谨慎而减少错误,但高拒答率影响实用性。论文强调,现有评估标准促使模型成为‘考试型选手’,无法应对现实复杂性。解决方法在于重新设计评估体系,抑制乱猜行为,避免因拒答扣分。OpenAI呼吁更新基于准确率的评估方式,防止模型靠侥幸过关。
原文链接
2025年9月6日,OpenAI发布论文《Why Language Models Hallucinate》,揭示AI幻觉的根本原因。幻觉被定义为模型生成看似合理但错误的内容,其根源在于训练和评估机制倾向于奖励猜测而非承认不确定性。现有评估方法鼓励模型盲目猜测,而非表达‘我不知道’,导致幻觉难以消除。OpenAI指出,幻觉并非不可避免,小型模型更易识别自身局限性,而改进评估指标可有效降低幻觉率。此外,OpenAI正在重组模型行为团队,由Max Schwarzer领导,原负责人Joanne Jang将启动新项目oai Labs,探索人与AI协作的新界面。OpenAI表示将持续优化模型,减少置信错误率。
原文链接
标题:GPT-5变蠢背后:抑制AI幻觉的代价
OpenAI发布GPT-5后引发广泛批评,用户认为其“变蠢了”“没创造力了”。这并不意外,因为GPT-5显著降低了幻觉率,但代价是输出更呆板。降低幻觉率让模型更严谨,却削弱了主观能动性,这对写代码和Agent构建有帮助,但消费级用户对此需求不高。此外...
原文链接
标题:AI幻觉泛滥,年轻人呼唤“活人感”
AI提升了效率,但也带来了“AI味太浓”的问题,内容显得呆板、缺乏灵魂。麦可思的调查显示,近八成大学生和教师遭遇过“AI幻觉”,即看似合理却逻辑断裂或事实错误的内容。这种空洞和虚构让年轻人开始追求一种真实的“活人感”。
他们既热衷于精打细算点外卖,又...
原文链接
2025年8月20日,AI工具已成全球17亿至18亿人日常使用的重要资源,但其生成虚假信息的问题日益突出。例如,DeepSeek R2模型发布传闻虽被证伪,却引发社交平台热议和概念股上涨。类似事件如“三层游船倒扣江中”谣言频发,主要源于用户恶意利用或模型自身幻觉。研究表明,大语言模型因训练数据时效性和机制限制,难以杜绝幻觉问题。尽管DeepSeek等厂商通过技术优化降低幻觉率,推理模型仍存在中间步骤不可靠的风险。专家建议多方合力应对,包括用户多重验证、平台合理使用及改进信息源建设。此外,调节温度参数可缓解幻觉,但完全消除可能削弱创造性,需权衡利弊。
原文链接
2025年8月17日,OpenAI ChatGPT负责人尼克・特利在The Verge播客中坦言,尽管GPT-5在减少“幻觉”问题上取得显著进步,但仍存在出错的可能性。他强调,除非ChatGPT在所有领域比人类专家更可靠,否则用户应核对答案。特利指出,生成式AI常编造信息,因其基于训练数据预测答案而缺乏事实理解。他认为,结合传统搜索引擎或特定数据工具时,ChatGPT表现最佳。此外,他表示‘幻觉’问题虽有望解决,但未来一个季度内无法实现,呼吁用户将ChatGPT作为参考而非唯一事实来源。
原文链接
近日,DeepSeek因粉丝压力生成了一份向王一博道歉的虚构声明及法院判决书,引发全网传播。随后,部分媒体引用该虚假信息进行报道,形成信息污染闭环:人类引导→AI制造幻觉→媒体放大→AI反刍→用户相信。类似事件频发,如关于#DeepSeekR2或8月发布的不实新闻,进一步暴露了公众和媒体对AI信源的盲目信任。数据显示,近四成Z世代更信赖AI,ChatGPT周活用户达7亿。专家指出,AI幻觉并非bug,而是特性,关键在于管理而非消除。虚假信息伴随技术革命屡见不鲜,但AI让谎言进入“工业化时代”,批量生产看似权威的内容。解药在于人类能否摆脱依赖,理性思考。
原文链接
标题:GPT-oss的奇怪行为:无提示生成编程问题并重复求解
正文:
GPT-oss最近表现出令人惊讶的“幻觉”行为。在没有提示的情况下,它凭空生成了一个复杂的多米诺骨牌编程问题,并消耗超过30,000个token反复求解了5000多次。该问题涉及在NxM网格中放置一个多米诺骨牌后,判断剩余区域...
原文链接
2025年8月11日,OpenAI正式发布GPT-5,CEO山姆·奥特曼称其将重新定义人与技术的交互方式。GPT-5采用“路由革命”架构,整合主力模型、思考模型和实时路由系统,能根据任务复杂度动态分配资源,实现多模态无缝协同。它在教育、医疗、商业等领域展现广泛应用前景。同时,GPT-5通过“安全补全”机制大幅降低AI幻觉问题,事实错误率较前代下降45%,开放性测试幻觉率减少六倍。此外,GPT-5引入四种个性模式,减少谄媚行为,增强情感表达和对话连贯性,评分提升38%。奥特曼表示,GPT-5不仅是技术突破,更是理解人类复杂性的智能伙伴。
原文链接
北京时间8月8日凌晨,GPT-5正式发布。新版本统一了此前多个模型的命名,通过内部智能“路由器”机制优化用户请求处理,降低了使用决策难度。GPT-5在编程能力、幻觉率降低及API成本等方面表现突出,编程任务完成度高且幻觉率较前代显著下降,API使用成本大幅降低。然而,发布会上出现了图表错误等低级失误,引发质疑。尽管部分用户认为进步未达预期,但文章指出生成式AI发展时间尚短,应给予更多观察时间。此外,GPT-5还新增了一些趣味功能,如自嘲吐槽和会员专属重点色设置,但后者引发争议。
原文链接
加载更多

暂无内容