当红炸子鸡DeepSeek,为何花心思自研存储?
这两天DeepSeek开源3FS并行文件系统的当红消息,犹如向AI基础设施领域投下一枚深水炸弹。炸鸡3FS每秒能搬运6.6TB数据,为何相当于1秒钟传输完700部4K高清电影。花心还能自动调资源,思自国产芯片用了它,研存跟国际大牌的当红差距直接缩小到15%。 这并非简单的炸鸡技术迭代——当Llama3 70B模型单次训练需吞掉15PB数据(相当于连续播放250万小时4K视频)时,全球AI实验室突然意识到:决定大模型训练效率的为何不仅是GPU算力,存储系统正成为影响进度的花心一大瓶颈。 当AI算力狂飙时,思自存储正在成为隐形战场 2024年,研存某头部AI公司曾因存储带宽不足,当红导致2000张A100显卡的炸鸡算力利用率长期低于40%,单日经济损失超百万美元。为何这暴露了AI时代的“木桶效应”——当GPU计算速度进入微秒级时,一次突发的存储抖动就可能导致整个训练任务崩溃,让数周的计算成果瞬间蒸发。这或许也是DeepSeek自研存储的原因。 数据显示,存储优化可直接将175B参数模型的训练周期压缩30%,对应百万美元级的成本被填平。而在推理端,当10%的异常请求遭遇存储延迟波动时,P99响应时间会瞬间突破SLA红线,这正是某自动驾驶公司在线服务突发降级的根本诱因。 DeepSeek之所以选择自研3FS的本质,正是发现了存储架构在AI应用中的重要性。《金融行业先进AI存力报告》中提到,在同样的GPU算力规模下,存储性能的高低可能造成模型训练周期数倍的差异。在算力竞赛的背后,一场关于存储性能密度的暗战悄然升级,自研存储显得尤为重要。 5家头部厂商角逐AI存储,国产能否拔得头筹 相比于传统AI的需求,大模型对存力需求场景具有数据量大、参数规模大、训练周期长等特点。 为了提升大模型训练速度,需要对大规模数据集进行快速加载,且一般采用数百甚至上万张GPU构成计算集群进行高效的并行计算,需要高并发输入/输出(I/O)处理,而训练数据集呈现海量小文件的特点,文件量在几亿到几十亿量级,对应的带宽需求可能每秒要达到上TB,这就要求存储系统具备强大的数据管理能力,业界能达到该能力的仅寥寥几家。 从国内外优秀的并行存储产品具体能力对比来看,IBM作为老牌存储品牌,其产品从HPC场景成功向AI场景演进。在全球AI场景得到广泛应用的DDN,多个读、写带宽等关键性能指标上表现突出,但DDN由于技术封闭性、专有化硬件等原因,导致用户建设成本过高。 国产厂商DeepSeek 3FS虽然是开源的新产品,但相对老牌存储也有不错的表现,在读带宽能力上表现优异,单集群6.6TB/s,平均单节点36.7GB/s的读带宽。 另一家国产厂商京东云云海,在这个专业领域同样表现出色,以单节点95GB/s的读带宽、60GB/s的写带宽,进一步拉低了国产存储与国际老牌厂商的差距。相较于DeepSeek的3FS,京东云云海在提供高性能的同时适用性更广,可以同时满足DeepSeek、ChatGPT、LLaMA等20余种主流大模型的存力需求。 综上来看,随着大模型快速向纵深场景演进,对存储的要求也越来越高,DeepSeek 3FS、京东云云海等国产存储,显示出在处理大规模数据集时的优越性能。未来国产存储能否拔得头筹,让我们拭目以待。
- 最近发表
-
- 违规开展学科培训,海口明和大教育等4家机构被查
- 傳郭台銘有意「併購」民眾黨,郭柯會確定破局,柯文哲:媒體報導讓幕僚嚇到了
- 美最高法院判平權招生違憲:專家憂衝擊企業多元文化,亞裔看法兩樣情
- 「主委」林子偉壓線參加中職季中選秀,可望創下野手最高薪,富邦領隊:「大家都想選」
- 学习重刷题、评价重考试 校外培训质量参差不齐
- 《心理摩擦力》:負面經驗的衝擊,比同等程度的正面時光還要強上五倍
- 一天吸引3000萬用戶註冊:Threads表示可單獨停用帳戶,推特控竊商業機密揚言提告
- 美國最高法院符合保守價值的四大宣判,是拜登競選連任求之不得的彈藥
- 荥经县夜间突击检查防汛值班情况4乡镇主要负责人受警告
- 【圖表】社群新戰場,Threads用戶突破1億創最速紀錄
- 随机阅读
-
- 给生物医药企业“加油” 深圳市医疗器械产业服务站挂牌
- 從爭取種族平權到「取消」政治不正確,覺醒(woke)文化如何撕裂美國社會?
- 高等教育並非「基本人權」,美國最高法院推翻「種族平權招生」並不違反自由進步觀念
- 高中生營隊安排「將金魚打成汁」,人性實驗引發學生驚嚇,成大教授致歉
- 教育的基础,在于如何理解“人”丨议教
- 盜取母校中國人民大學學生個資建立外貌評分網站,騰訊程式設計師被警方拘捕
- 純粹西方的幻想?語言文字和織物作為藝術媒介的一些思考
- 愛的回憶使人無畏死亡——普魯斯特文學的兩部經典電影
- 石棉县人民法院推进“诚信石棉”专项审判活动
- 台塑新智能加碼投資新能源上看200億, 王瑞瑜:關鍵技術電池芯已接近100%本土製造
- 瑞秋卡森《海風下》:鯖魚史康波大難不死,如今已名正言順是浮游生物社群裡的一員了
- 【2023台北電影獎】最佳導演《疫起》林君陽:20年前的事情對大家很重要,過去3年也很重要
- 扫码点餐,不应该是唯一选择
- 《世界史躺著讀Ⅰ》:大元大蒙古國是一個就連「名叫馬可波羅的人」都能夠自由進出的「樂市樂座」之國
- 「尋探老屋生命線」:打破課本學習框架,帶著孩子走進社區向「在地」學習
- 分科測驗物理科:難易度適中、鑑別度高,建中老師認為3題混合題考驗閱讀能力「出得最好」
- 注意 市区2个路口右转须按信号灯通行
- 「柯察鐵」、「王抗美」到「娜娜」,那些圖謀愛國財的虛假中國「歪果仁」
- 《佛繫愛情》:無常為愛帶來痛苦,帶來無限
- 【小說】《鬼市傳說1》選摘:攤販老闆說有了木偶一定可以心想事成,但這幾天卻毫無音訊
- 搜索
-
- 友情链接
-