摘要:针对当前音频场景识别中训练数据量不足的问题,设计了基于知识迁移的非对称卷积声音场景识别系统。 相较于现有 方法利用音频场景识别数据集从头训练网络模型,该系统在其他任务训练好的网络模型上进行调整和训练,从而保留了源领域 的有效信息。 与此同时,该系统针对声学特征的特点,采用了非对称卷积模块来增强网络的特征提取能力。 实验结果为该系统 的准确率相较基准系统提高了 0. 023,并且该系统的卷积核可视化结果观察到的特征纹理更清晰。 结果表明知识迁移可以提 升模型的特征表示能力,与非对称卷积结合能进一步提升系统性能。