摘要:现阶段,图像深度学习算法无法检测时序性的工艺流程问题。 本文针对针织机械山板总成的人为装配工艺进行研究, 提出 MS-RetinaNet 目标检测算法。 借鉴自然语言处理的思想,引入 Swin-Transformer 结构,保留了 CNN 结构的层次性,弥补了 CNN 结构对于高层语义信息融合不足的问题,增强了全局与细节学习能力;使用改进的 GIoU Loss,增加判定因子式,缓解损失 计算退化的影响,优化边界框回归效果;根据多尺度目标参数,采用最佳锚框比,提高了召回率和检测精度;设计时序检测头,使 算法具有判别目标先后顺序和逻辑关系的能力。 实验结果表明,算法 AP 可达 90. 3%,高于当前主流算法 2%以上,单张图片检 测速度约 46 ms,满足了工艺流程的时序检测要求,综合性能优越。