當前位置:首頁 > 科技文檔 > 硬件 > 正文

從BERT到ChatGPT:大模型訓練中的存儲系統(tǒng)挑戰(zhàn)與技術發(fā)展

計算機研究與發(fā)展 頁數(shù): 15 2024-01-08
摘要: 以ChatGPT為代表的大模型在文字生成、語義理解等任務上表現(xiàn)卓越,引起了工業(yè)界和學術界的廣泛關注.大模型的參數(shù)量在3年內(nèi)增長數(shù)萬倍,且仍呈現(xiàn)增長的趨勢.首先分析了大模型訓練的存儲挑戰(zhàn),指出大模型訓練的存儲需求大,且具有獨特的計算模式、訪存模式、數(shù)據(jù)特征,這使得針對互聯(lián)網(wǎng)、大數(shù)據(jù)等應用的傳統(tǒng)存儲技術在處理大模型訓練任務時效率低下,且容錯開銷大.然后分別闡述了針對大模型訓練的3類... (共15頁)

開通會員,享受整站包年服務立即開通 >