国产欧美精品一区二区,中文字幕专区在线亚洲,国产精品美女网站在线观看,艾秋果冻传媒2021精品,在线免费一区二区,久久久久久青草大香综合精品,日韩美aaa特级毛片,欧美成人精品午夜免费影视

基于FPGA的量化推理CNN加速系統研究與設計
DOI:
CSTR:
作者:
作者單位:

廣東工業(yè)大學(xué)物理與光電工程學(xué)院

作者簡(jiǎn)介:

通訊作者:

中圖分類(lèi)號:

基金項目:

廣東省科技計劃項目 (2017A020208063); 廣州市科技計劃項目 (201804010384)


Research and design of CNN acceleration system for quantitative reasoning based on FPGA
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 圖/表
  • |
  • 訪(fǎng)問(wèn)統計
  • |
  • 參考文獻
  • |
  • 相似文獻
  • |
  • 引證文獻
  • |
  • 資源附件
  • |
  • 文章評論
    摘要:

    基于FPGA的量化推理設計了CNN加速系統。通過(guò)對主流的深度神經(jīng)網(wǎng)絡(luò )結構的運算特性分析,使用(Density-Based Spatial Clustering of Applications with Noise) DBSCAN聚類(lèi)算法截取閾值的INT8量化推理方法,融合深度神經(jīng)網(wǎng)絡(luò )全連接,減少數據運算位寬和壓縮網(wǎng)絡(luò )大小,在準確率損失很小的情況下有效壓縮了網(wǎng)絡(luò )結構。基于LeNet-5、VGG-16與ResNet-50的CNN網(wǎng)絡(luò )結構,設計出量化CNN加速系統并進(jìn)行校驗。實(shí)驗結果表明,網(wǎng)絡(luò )參數和輸入特征數據量化精度為8-bits時(shí),網(wǎng)絡(luò )壓縮率在25%的情況下,網(wǎng)絡(luò )準確率的損失低于1%。在Xilinx XC7K325 平臺上量化推理CNN加速系統的運行頻率為450 MHz,與其他相似類(lèi)型的加速器比較,其GOPS性能提升2倍。

    Abstract:

    Based on the quantitative reasoning of FPGA, the CNN acceleration system is designed. Through the analysis of the operation characteristics of the mainstream deep neural network structure, the int8 quantitative reasoning method of intercepting the threshold using the (density based spatial clustering of applications with noise) DBSCAN clustering algorithm is used to integrate the full connection of the deep neural network, reduce the data operation bit width and compress the network size, and effectively compress the network structure with little loss of accuracy. Based on the CNN network structure of lenet-5, vgg-16 and resnet-50, a quantitative CNN acceleration system is designed and verified. The experimental results show that when the quantization accuracy of network parameters and input characteristic data is 8-bits, the loss of network accuracy is less than 1% when the network compression rate is 25%. On Xilinx xc7k325 platform, the running frequency of CNN acceleration system is 450 MHz. Compared with other similar accelerators, its GOPs performance is improved by 2 times.

    參考文獻
    相似文獻
    引證文獻
引用本文

何家俊,蘇成悅,羅榮芳,施振華,陳堆鈺,羅俊豐.基于FPGA的量化推理CNN加速系統研究與設計計算機測量與控制[J].,2022,30(9):162-169.

復制
分享
文章指標
  • 點(diǎn)擊次數:
  • 下載次數:
  • HTML閱讀次數:
  • 引用次數:
歷史
  • 收稿日期:2022-03-16
  • 最后修改日期:2022-06-23
  • 錄用日期:2022-04-13
  • 在線(xiàn)發(fā)布日期: 2022-09-16
  • 出版日期:
文章二維碼
通辽市| 邯郸市| 剑河县| 宿松县| 张家港市| 玉门市| 宜君县| 兰考县| 普陀区| 台湾省| 东方市| 平原县| 蒲城县| 鸡西市| 余姚市| 读书| 南丰县| 哈巴河县| 漯河市| 玉树县| 巢湖市| 东乌| 花垣县| 秦安县| 大埔区| 城固县| 柳州市| 通海县| 莲花县| 贵溪市| 甘谷县| 中卫市| 诸城市| 临城县| 瑞丽市| 邳州市| 陵水| 上高县| 武夷山市| 曲靖市| 汉中市|