摘要:在工业故障分类过程中有标记样本数量少而人工标注成本高会导致分类器精度难以提高,而大量包含丰富信息的无 标记样本却没有得到充分利用。 针对上述问题,提出了一种结合主动学习(AL)和最优路径森林算法(OPF)的半监督故障分类 模型(AL-OPF)。 该方法首先利用 BvSB 和余弦相似度准则综合衡量样本的价值量,以排序批处理模式筛选价值高的样本,并 获取其标签扩充初始标记样本集,然后通过构建最优路径森林实现半监督标签传播,最后在实验室采集得到的管道故障样本集 上进行实验验证。 实验结果表明,该方法能在有标签样本为 10%的情况下达到 96. 68%的整体识别准确率,与逐个采样模式的 主动学习方法以及基于距离度量提取训练样本全局结构信息的半监督方法相比,所提出方法拥有更高的 Recall 值和 F1- score 值 关键词: 。