本技术涉及一种噪声识别技术及其设备,该技术包括:捕获环境声音数据,当环境声音数据的声压低于预设阈值时,提取声音数据的声学特征并输入至噪声识别网络,以生成噪声事件帧。
背景技术
随着城市噪声问题的日益突出,噪声污染防治的需求逐渐增多,噪声监测体系需要不断完善。噪声事件检测,属于音频模式识别的声音事件检测领域的范畴,其目的是在检测一段音频中,是否出现目标噪声音频事件并标注其起止时间,通过对噪声事件检测的数据进行分析,从而为噪声监测管理部门提供区域的噪声事件以及统计分析。
目前深度学习方法在音频模式识别领域里已经有了不少的成果,为噪声事件检测提供了坚实的基础。然而,在传统的监督学习任务中,缺乏噪声标注数据以及现实场景数据集不充分导致传统的有监督训练方法表现不佳,对音频数据的训练精度差;现实情况下存在大量的无标签数据,而在自监督学习任务中,通常音频数据场景比较单一,也没有利用实地数据进行校准训练,对噪声检测模型进行优化效率低,音频检测性能差。
实现思路