一级黄色片免费播放|中国黄色视频播放片|日本三级a|可以直接考播黄片影视免费一级毛片

高級搜索

留言板

尊敬的讀者、作者、審稿人, 關(guān)于本刊的投稿、審稿、編輯和出版的任何問題, 您可以本頁添加留言。我們將盡快給您答復。謝謝您的支持!

姓名
郵箱
手機號碼
標題
留言內(nèi)容
驗證碼

論文元數(shù)據(jù)搜索,找到相關(guān)信息共 1 條:

排序:
相關(guān)度
發(fā)表時間
每頁顯示:
10
20
30
50
一種基于三維可變換CNN加速結(jié)構(gòu)的并行度優(yōu)化搜索算法
屈心媛, 徐宇, 黃志洪, 蔡剛, 方震
2022, 44(4): 1503-1512. doi: 10.11999/JEIT210059  刊出日期:2022-04-18
關(guān)鍵詞: 現(xiàn)場可編程門陣列, 卷積神經(jīng)網(wǎng)絡(luò), 硬件加速
現(xiàn)場可編程門陣列(FPGA)被廣泛應用于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的硬件加速中。為優(yōu)化加速器性能,Qu等人(2021)提出了一種3維可變換的CNN加速結(jié)構(gòu),但該結(jié)構(gòu)使得并行度探索空間爆炸增長,搜索最優(yōu)并行度的時間開銷激增,嚴重降低了加速器實現(xiàn)的可行性。為此該文提出一種細粒度迭代優(yōu)化的并行度搜索算法,該算法通過多輪迭代的數(shù)據(jù)篩選,高效地排除冗余的并行度方案,壓縮了超過99%的搜索空間。同時算法采用剪枝操作刪減無效的計算分支,成功地將計算所需時長從106 h量級減少到10 s內(nèi)。該算法可適用于不同規(guī)格型號的FPGA芯片,其搜索得到的最優(yōu)并行度方案性能突出,可在不同芯片上實現(xiàn)平均(R1, R2)達(0.957, 0.962)的卓越計算資源利用率。