本公开提供了一种模型训练方法,涉及人工智能技术领域,尤其涉及深度学习、图像处理、计算机视觉等技术领域,具体涉及一种模型训练方法、装置、电子设备及存储介质。具体实现方案为:获取用于模型训练的各个样本;将所获取的样本分别输入待训练的半监督模型,得到输出结果;利用所述输出结果与各个样本所具有的标签的差异,以及所述伪标签对应的损失权重,计算模型损失;基于所述模型损失调整所述半监督模型的模型参数,从而获得目标半监督模型。通过本方案,可以提升半监督模型的精度;并且,通过更为准确的模型损失,可以使得模型的收敛速度得到加快,降低针对计算资源的占用时长,从而节省模型训练时所利用的计算资源。
背景技术
半监督模型是利用半监督学习方式训练的模型,半监督学习方式即利用部分标注的样本和部分未标注的样本进行深度学习的方式。其中,半监督模型所能够实现的任务可以包括:对象检测任务,例如图像检测任务或文本检测任务,当然并不限于此。
为了保证半监督模型能较快的收敛,从而避免长时间占用计算资源,在半监督模型训练过程中可以针对未标注的样本来生成伪标签,从而利用未标注的样本以及所生成的伪标签进行模型训练。
实现思路