开源周进入第五天,幻方AI发布了备受期待的开源项目3FS,这是他们自研的高速读写文件系统。3FS最早在2022年发布技术概览,全称是萤火超算文件系统(Fire-Flyer File System),因其三个连续的F而简称3FS。
最初,3FS仅限内部使用,依赖特定硬件。如今,开源版本带来了显著改进。3FS专注于AI训练中计算节点的模型批量读取,通过高速计算存储交互加速模型训练。它采用了分解式架构,全栈解耦、协议优化和生态兼容使其成为通用型AI存储基础。
存储与计算分离后,数据流动不再受限于物理位置。3FS使用FFRecord格式管理数据库,将数百万小文件整合成逻辑大文件,并通过索引快速访问。例如,它能在0.29秒内加载ImageNet数据集,比传统方法快得多。
此外,3FS引入了KVCache技术,通过缓存优化大语言模型的推理过程。KVCache能以高达40GiB/s的速度进行读取,存储于SSD硬盘上的数据传输速度接近DRAM的90%,且成本仅为DRAM的十分之一。通过RDMA网络,传输速率可达40GB/s,相当于一秒传输80部高清电影。
3FS不仅提升了性能,还重新定义了AI训练的底层逻辑,实现了存储介质、网络协议和分布式算法的深度协同,使存储系统从被动仓库升级为智能供血系统。
原文链接
本文链接:https://kx.umi6.com/article/14522.html
转载请注明文章出处
相关推荐
.png)
换一换
Meta 被曝助推数字盗版:30% 训练 AI 书籍遭二次传播
2025-03-27 10:46:05
马斯克:AI训练去年就已耗尽现实世界的所有资料
2025-01-13 17:57:57
创作心血变AI养料?网文作者“揭竿而起”
2024-07-30 19:30:57
403 文章
54002 浏览
24小时热文
更多

-
2025-07-20 23:09:27
-
2025-07-20 22:09:17
-
2025-07-20 21:10:03