針對(duì)SW26010眾核處理器的單精度矩陣乘算法
小型微型計(jì)算機(jī)系統(tǒng)
頁(yè)數(shù): 9 2022-02-14
摘要: 矩陣乘作為許多科學(xué)應(yīng)用中被頻繁使用的關(guān)鍵部分,其計(jì)算量巨大且稠密的本質(zhì),使得高性能計(jì)算領(lǐng)域中矩陣乘并行算法的研究一直是經(jīng)久不衰的熱門(mén)話題.隨著我國(guó)自主研發(fā)的申威眾核處理器SW26010在科學(xué)計(jì)算和人工智能領(lǐng)域的快速發(fā)展,對(duì)面向SW26010眾核處理器的高性能矩陣乘算法提出了迫切的需求.針對(duì)SW26010眾核處理器的體系結(jié)構(gòu)特征,首次對(duì)單精度矩陣乘實(shí)現(xiàn)進(jìn)行了深入探討,提出了3種不... (共9頁(yè))