面向 FPGA 部署的 CNN-SVM 算法研究与实现
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

TN911. 73

基金项目:

国家自然科学基金(61671170)项目资助


Research and implementation of CNN-SVM algorithm based on FPGA
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    卷积神经网络-支持向量机(CNN-SVM)混合算法结合了 CNN 特征提取能力和 SVM 分类性能,在计算复杂度和解决小 样本问题上具有一定优势,目前已在故障诊断、医学图像处理等领域得到了一定应用,同时,由于其计算复杂度较低,也引起了 边缘计算领域的关注。 针对边缘计算场景中对算法性能和功耗的要求,提出了一种面向 FPGA 平台的 CNN-SVM 算法优化与实 现方法。 首先,结合 FPGA 的架构特点,对 CNN-SVM 算法结构进行了硬件适应性优化,包括模型压缩和分类器核函数的选取。 其次,采用了软硬件协同和高层次综合( HLS) 设计方法,完成了 CNN-SVM 算法加速器的设计与实现。 实验结果表明,在 ZCU102 上,加速器的 FPS(frames per second)达到了 18. 33 K,计算速度为 1. 474 GMAC/ s,相对于 CPU 平台四核 Cortex-A57 和 Ryzen7 3700x 分别实现了 23. 57 和 4. 92 倍加速,相对于 Jetson Nano GPU 和 GTX750 平台能耗比分别达到了 33. 24 和 50. 27。

    Abstract:

    CNN-SVM hybrid algorithm combines the feature extraction ability of CNN and the classification performance of SVM, it has certain advantages in computational complexity and can solve small sample problem. It has been applied in fault diagnosis, medical image processing and other fields, at the same time, it gets attention in the field of edge computing due to its low computational complexity. Aiming at the requirements of algorithm performance and power consumption in edge computing scenarios, an optimization and implementation method of CNN-SVM algorithm for FPGA platform is proposed. First, combined with the architecture characteristics of FPGA, the hardware adaptability optimization of CNN-SVM algorithm structure is carried out, including the model compression and the selection of kernel function of classifier. Secondly, the design and implementation of CNN-SVM algorithmic accelerator is completed by using software and hardware cooperation and high level synthesis ( HLS) design method. The experimental results show that on ZCU102, the frames per second(FPS) of accelerator reaches 18. 33 K, the computing speed is 1. 474 GMAC/ s. Compared with the CPU platform, quad core Cortex-A57 and Ryzen7 3700x achieve 23. 57 and 4. 92 times acceleration respectively, compared with Jetson Nano GPU and GTX750 platform, the energy consumption ratio is 33. 24 and 50. 27 respectively.

    参考文献
    相似文献
    引证文献
引用本文

周彦臻,吴瑞东,于 潇,付 平,刘 冰,李君宝.面向 FPGA 部署的 CNN-SVM 算法研究与实现[J].电子测量与仪器学报,2021,35(4):90-98

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2023-02-23
  • 出版日期: