热门AI角色扮演应用Character.ai由Transformer作者Noam Shazeer创立,其流量已占2024年谷歌搜索20%,每秒处理2万推理请求。沙哥公开了优化秘诀,包括内存高效架构(KV缓存减小20倍)、Attention状态缓存(95%请求无需重算)和原生int8训练。团队通过创新方法如MQA、混合注意力视野和跨层KV共享,显著降低推理成本,使得处理大规模流量的成本远低于商业API。此外,沙哥的远见和工程实力在业界备受瞩目,Meta和特斯拉都表达了合作意向。
原文链接
本文链接:https://kx.umi6.com/article/1823.html
转载请注明文章出处
相关推荐
换一换
两位00后,融资8个亿
2024-06-29 16:53:08
5090跑《黑神话》飙到200+帧,英伟达DLSS也用上Transformer了
2025-01-17 17:20:30
最火AI角色扮演流量已达谷歌搜索20%!每秒处理2万推理请求,Transformer作者公开优化秘诀
2024-06-21 15:42:20
腾讯推出 Hunyuan-Large 大模型:389B 总参数,业界已开源基于 Transformer 的最大 MoE 模型
2024-11-05 17:04:28
30人,25亿美元卖身,大模型淘汰赛加速
2024-08-04 13:21:08
何恺明LeCun改造Transformer!9行代码替代归一化性能不减还加速
2025-03-14 16:15:26
苹果AI选Mamba:Agent任务比Transformer更好
2025-10-21 14:27:27
132年未解开的李雅普诺夫函数谜题,被AI攻克了?
2024-10-20 20:02:17
大模型公司并购潮渐起,谷歌25亿美元买下Character.AI
2024-08-05 20:56:45
Meta据悉与Character.ai就合作进行讨论
2024-05-27 09:19:20
被科技巨头围剿的AI男友,快聊不动了
2024-07-11 19:29:24
聊天机器人平台 Character.AI 在美再遭起诉:对青少年及家庭构成威胁,恶化心理问题
2024-12-11 12:24:39
大模型玩不好数独?!Transformer作者初创公司公布排行榜:o3 Mini High“变异数独”正确率仅2.9%
2025-05-28 16:36:56
546 文章
270560 浏览
24小时热文
更多
-
2025-10-25 18:38:20 -
2025-10-25 18:37:15 -
2025-10-25 16:32:54