面向GPU集群的動(dòng)態(tài)資源調(diào)度方法
計(jì)算機(jī)研究與發(fā)展
頁(yè)數(shù): 14 2022-10-27
摘要: 深度神經(jīng)網(wǎng)絡(luò)(deep neural network,DNN)已廣泛應(yīng)用于人類社會(huì)的許多領(lǐng)域.大規(guī)模的DNN模型可顯著提高識(shí)別精度,然而在單個(gè)GPU設(shè)備上訓(xùn)練大規(guī)模的DNN模型需要耗費(fèi)大量的時(shí)間.因此,如何借助分布式深度學(xué)習(xí)(distributed deep learning,DDL)技術(shù),在GPU集群上并行地訓(xùn)練多DNN模型已受到工業(yè)界和學(xué)術(shù)界的廣泛關(guān)注.基于此,提出一種面向... (共14頁(yè))