論文元數(shù)據(jù)搜索,找到相關信息共 1 條:
2022, 44(4): 1503-1512.
doi: 10.11999/JEIT210059
刊出日期:2022-04-18
現(xiàn)場可編程門陣列(FPGA)被廣泛應用于卷積神經(jīng)網(wǎng)絡(CNN)的硬件加速中。為優(yōu)化加速器性能,Qu等人(2021)提出了一種3維可變換的CNN加速結構,但該結構使得并行度探索空間爆炸增長,搜索最優(yōu)并行度的時間開銷激增,嚴重降低了加速器實現(xiàn)的可行性。為此該文提出一種細粒度迭代優(yōu)化的并行度搜索算法,該算法通過多輪迭代的數(shù)據(jù)篩選,高效地排除冗余的并行度方案,壓縮了超過99%的搜索空間。同時算法采用剪枝操作刪減無效的計算分支,成功地將計算所需時長從106 h量級減少到10 s內(nèi)。該算法可適用于不同規(guī)格型號的FPGA芯片,其搜索得到的最優(yōu)并行度方案性能突出,可在不同芯片上實現(xiàn)平均(R1, R2)達(0.957, 0.962)的卓越計算資源利用率。