摘要:卷积神经网络-支持向量机(CNN-SVM)混合算法结合了 CNN 特征提取能力和 SVM 分类性能,在计算复杂度和解决小 样本问题上具有一定优势,目前已在故障诊断、医学图像处理等领域得到了一定应用,同时,由于其计算复杂度较低,也引起了 边缘计算领域的关注。 针对边缘计算场景中对算法性能和功耗的要求,提出了一种面向 FPGA 平台的 CNN-SVM 算法优化与实 现方法。 首先,结合 FPGA 的架构特点,对 CNN-SVM 算法结构进行了硬件适应性优化,包括模型压缩和分类器核函数的选取。 其次,采用了软硬件协同和高层次综合( HLS) 设计方法,完成了 CNN-SVM 算法加速器的设计与实现。 实验结果表明,在 ZCU102 上,加速器的 FPS(frames per second)达到了 18. 33 K,计算速度为 1. 474 GMAC/ s,相对于 CPU 平台四核 Cortex-A57 和 Ryzen7 3700x 分别实现了 23. 57 和 4. 92 倍加速,相对于 Jetson Nano GPU 和 GTX750 平台能耗比分别达到了 33. 24 和 50. 27。