本技术涉及一种利用Transformer声谱图特征学习技术进行母牛发情检测的方法和装置。该方法包括:对采集的母牛声音数据进行等时长分割和降噪处理;对降噪后的声音片段进行标注;将声音片段转换为梅尔声谱图并进行数据增强;构建基于Transformer的模型,利用多头自注意力机制提取梅尔声谱图的深度特征;最后,构建基于通道注意力机制的母牛发情声音事件检测模型,输入深度特征,通过深度学习对时域线索进行分类和串联,实现对母牛发情声音事件的检测,并输出发情事件发生的时间和概率。本发明通过注意力机制识别和定位母牛声音事件,实现基于声音信号的母牛发情检测。
背景技术
随着信息技术时代的发展,越来越多的人工智能技术被应用于智慧农业的发展。养牛业是我国畜牧业的重要组成部分,而且我国牛肉市场的需求连年增加。各肉牛养殖户通过人工授精的方法来扩大自己的养殖规模,为了使受精工作更具有高效性,养牛户需要对肉牛的发情周期做出判断。对母牛发情的检测方法主要是以观察为主,如对母牛激素水平的判断、实时观察以及生殖器触诊。(参见余慧芳的《浅析母牛发情期观察的几个要点》,《畜牧兽医科学》,2018,第6期)。这些方法虽然精度较高,但是要求畜牧人员实时在场,消耗大量的人力物力,并且不能实现远程实时监控。各大养牛企业的一线生产经验表明,母牛发情时具有典型的听觉特征,例如:频繁哞叫,叫声中具有吸引公牛交配的信息。
机器学习属于人工智能的一个类目,深度学习是机器学习中一种基于神经网络的数据表征学习方法。声音事件检测是音频模式识别的一个具体领域,其目的是在检测一段音频中,是否出现目标音频事件以及标注其起止时间。这些技术为使用深度学习方法来进行母牛发情的声音事件检测提供了坚实的基础。然而,缺乏标注数据是构建基于监督学习的深度学习模型的一大难题;并且,由于不同养殖环境的复杂度不同,检测的准确率也会受到较大的影响。
实现思路