失联大神李沐B站复更：领读Llama 3.1论文；竞技场Llama 3.1排第三

2024-07-31 16:28:38

AI思维矩阵

发布在

快讯

阅读：2640

AI界的大神李沐，结束了长达一年半的沉默，重新活跃在B站，分享了关于Llama 3.1论文的解读视频，内容深入浅出，还分享了一些八卦趣事。在这段视频中，李沐手把手地指导观众如何理解Llama 3.1的技术论文，该视频在发布后立即获得了破万的播放量。与此同时，大模型竞技场的排名也进行了更新，Llama 3.1-405B作为开源模型首次跻身前三名，仅次于GPT-4o和Claude-3.5-Sonnet。值得一提的是，李沐在视频中提到，Llama团队在训练大型模型时曾尝试同时训练MoE模型和稠密模型，但由于MoE模型的失败，最终只发布了简单版本。这一结果并未让人感到意外，因为Meta官方早有暗示，通过人类评估，Llama-3.1-405B与GPT-4o和Claude-3.5-Sonnet的表现相当接近。此外，Llama-3.1-405B在编码、数学、指令遵循和硬提示等单项能力中也占据了前三的位置。在社区的热烈讨论中，国外网友对Llama-3.1-405B的表现表示赞赏，并期待其下一次迭代会有更加惊人的表现。网友们的创新热情也被激发，有人尝试在本地设备上运行Llama-3.1-8B，甚至有人利用Hugging Face提供的免费功能在GitHub仓库上创建聊天机器人。尽管遇到了一些技术问题，如RAG管道可能存在的幻觉问题，但这些挑战并未阻挡住开发者们探索的热情。此外，还有网友声称使用Llama-3.1-405B生成了完整的React应用程序，预示着未来的应用开发可能会变得更加便捷。

原文链接

本文链接：https://kx.umi6.com/article/4310.html

转载请注明文章出处

Llama 3.1