本技术介绍了一种创新的半监督图像识别技术,该技术利用自适应对比学习。该方法首先将有标签和无标签的图像输入至数据增强模块,以产生增强后的图像样本。随后,这些增强样本被送入特征编码器以提取特征。
背景技术
随着数据量的迅速增长和硬件技术的不断提升,机器学习,尤其是深度学习算法,正在各个领域中变得愈发普及,并被广泛应用于实际场景中。深度学习凭借其强大的自动化特征提取能力,极大地推动了图像识别、自然语言处理、语音识别等领域的技术进步。特征工程长期以来一直是机器学习的一个重要研究方向,它关注于从原始数据中构建特征。此外,特征工程通常是特定领域的,且需要手工提取。一旦一个新特征被提出并表现良好,它将成为多年的趋势。而深度学习算法模仿人脑工作,通过网络自动提取最有效的特征,这些算法包括数据表示的层级结构,其中高层特征可以从网络的最后一层提取,而底层特征则可以从较低层提取。
深度学习在图像识别领域取得了显著的成功,图像识别任务的效率在很大程度上取决于输入数据表示的好坏。但考虑到现实的复杂条件,带标签的数据很难获得,反而是无类别标签的样本获取起来相对容易一些。显然,考虑到标注成本问题后,我们可以发现相较于数据总量,可能标注的数据占比是较少的。因此,在有监督的学习图像识别任务中,学习时仅仅使用了有标记的数据样本,但我们在实际应用中必须依赖没有标记的数据的样本来决策。这就需要我们在训练过程中,必须考虑到可能出现的无标记的样本。而在有监督学习的图像识别任务中,通常需要大量准确的、独立的、均匀分布的训练数据来训练一个鲁棒的模型,然而处理训练数据的难度较大,耗时较长导致获取有标签的数据成本过高,即使得到这些有标签的样本,由于其数量相当有限,所训练出来的模型也难以体现真实的状况;其次,如果只对占总体数据样本很小部分的有标签的样本进行训练,就会造成占比较大的没有标签的样本被浪费,不能做到物尽其用;最关键的是,不同类别的数据分布不均衡,这可能会使样本量小的类别数据量不足,难以学习关键特征,不能获得泛化能力很好的神经网络模型。从而致使有监督学习算法识别效果有所缺失。因此,只有全面考虑无标签数据时,才能明确决策边界,确定数据的真实分布。无标签数据的加入,会在标签较少或完全移除标签时辅助训练更鲁棒的图像识别模型,甚至优于有监督的情况。
综上所述,相关技术的图片识别技术存在的主要问题:(1)无法充分利用无监督数据,导致训练样本数据量少,训练得到的模型鲁棒性不高。(2)训练使用的数据集不同类别的数据分布不均,使得样本量小的类别数据量不足,难以学习关键特征,获得的神经网络模型泛化能力不足。
实现思路