本技术涉及一种创新的数据标注流程,包括数据标注、标注员考核及标注结果审核。该方法首先接收来自用户的多个第一标注信息,这些信息基于预设的标注规则生成。接着,通过标注员考核机制确保标注质量,最后对标注结果进行审核,以保障数据的准确性和可靠性。
背景技术
目前监督式学习和半监督式学习的核心是把数据特征处理后提供给机器进行训练。数据是人工智能的血液,而数据只有加上标注信息才有意义,大量优质的训练数据使算法可以通过学习从而形成更好的模型。为了提供包含标注信息的数据,目前的标注方式大都是采用众包的方式进行标注,众包标注数据的方法一般有两种:离线组织众包数据标注以及在线组织众包数据标注。无论是哪种数据标注方法,其标注内容之间都相对独立,比如,在当前画面中分别标注出所有人物的头部以及所有人物的四肢,缺乏标注内容之间关系的描述,导致使用当前的标注方法进行数据标注时,挖掘到的图像信息相对单一,信息量有限,使得模型训练时,难以进一步深刻理解图像信息。
实现思路