1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

1950年左右,信息论鼻祖香农和妻子贝蒂玩了一个“猜字母”游戏:香农给前文,贝蒂猜下一个字母。猜对画短横,猜错写原字母。这其实是人类最早的“预测下一个词”实验,贝蒂堪称世界上第一个“大语言模型”。

这个游戏揭示了信息论的核心:语言可预测,而可预测就意味着可压缩。被短横替代的文本变短了,但信息没丢。香农借此指出,预测和压缩是一体两面。越容易预测的内容信息量越小;完全猜不到的“意外”才是真正的信息。衡量这种不确定性的指标即为“熵”。

今天的大语言模型(如GPT)本质上也在做同样的事。它们吸收海量数据,努力预测下一个词。模型预测得越准,交叉熵损失(Loss)就越低,这就相当于当年贝蒂画下的一个个短横。

虽然单纯的压缩不等于智能,但智能的核心能力之一,正是捕捉世界运行的可预测规律。七十多年过去,当年贝蒂猜对字母时画下的短横,如今已化作大模型不断降低的Loss,成为了AI进化的基石。

原文链接
本文链接:https://kx.umi6.com/article/36837.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Canalys:预计2029年生成式AI市场规模达728亿美元
2024-12-11 16:38:47
警惕AI大模型的“共情鸿沟”,剑桥团队呼吁:我们需要“儿童安全人工智能”框架
2024-07-11 15:47:39
美团CEO王兴:将继续加大投资开发大语言模型
2025-05-26 21:54:46
新研究:人工智能可提前两周预测严重心律失常风险
2025-04-03 13:20:59
美国哥伦比亚大学研究:大语言模型正在变得越来越像人类大脑
2024-12-20 11:27:54
OpenAI 发布新模型 奥特曼:耐心时刻结束了
2024-09-16 01:58:25
“给 AI 讲故事”就能绕过安全机制,恶意代码编写门槛恐将大幅降低
2025-03-19 23:56:20
我被AI骗了
2025-02-27 14:24:34
上交大智能计算研究院论文:不只算对答案,大模型如何真正学会运筹建模丨ICLR 2026
2026-02-03 23:02:59
2000美元一只“草莓”,OpenAI 新模型价格挑战用户底线?
2024-09-06 21:00:01
攻略在手,轻松玩转 DeepSeek
2025-02-08 21:33:12
压缩算法为大语言模型“瘦身”
2024-11-22 08:57:50
蔡恒进:具备独立思考与问题解决能力的AI才是未来发展方向|直击2024外滩大会
2024-09-05 19:39:46
24小时热文
更多
扫一扫体验小程序