本技术属于图像处理与计算机视觉技术领域,具体涉及一种基于改进SE注意力机制的足球运动动作检测算法,该方法基于YOWO网络,该网络分别将RGB视频连续帧和RGB关键帧信息输入到时序检测模块和空间检测模块进行处理;在时序检测模块中,引入SE注意力机制,同时在SE注意力机制的池化层前添加连续的3D深度可分离卷积和残差连接,使网络更加关注浅层和深层的特征信息,确保关键信息被保留,从而提升3D卷积网络的时空特征提取能力;在空间检测模块中,用YOLOV2进行空间特征提取;然后将时空特征和空间特征进行特征融合,最后对这些融合特征进行检测,得到该视频目标行为所属的类别、持续时间和位置信息。
背景技术
时空行为检测是一个重要的计算机视觉领域,主要任务是在视频中检测目标的行为类别,并准确定位行为发生的时间和位置。近年来,深度学习在动作识别方面取得了突破性进展,使得研究者不再满足于简单的粗粒度动作识别。如今,研究者已经将动作识别与体育赛事相结合,利用深度学习技术来实现体育赛事视频中关键动作的智能识别和分析。而YOWO 因其简单的模型结构和能快速识别视频信息的特点被应用于视频分析领域。但原始YOWO 网络在自制的行为数据集上。由于样本特征有限,使得模型学习到的特征也有限,从而导致模型的检测精度不高,通过分析发现,YOWO 的网络结构存在两个问题:一是YOWO 的2D 特征提取网络没有获取时间上下文信息的能力,因此针对具有相似的行为容易误判;另一个是 YOWO 的 3D 特征提取网络时序信息提取上获得了较大提升,但是需要消耗大量的计算资源,运行的时间成本较高,如何将其轻量化,真正地应用到实际,实现实时运行很重要。因此,提升时空行为检测的准确率和检测速度具有重要的研究意义。
实现思路