本技术涉及一种图像识别与匹配技术及系统,包括步骤:捕获第一图像数据;对第一图像数据执行特征识别,提取特征识别数据;以及对第一图像数据进行匹配处理,实现高效图像识别与匹配。
背景技术
近年来,随着大模型技术的突飞猛进,需要从互联网搜集海量的语料库作为训练素材。但是很多数据源针对爬虫采用了反爬机制。主要包括:设置robots.txt文件限制、限制UserAgent字段进行访问过滤、基于用户访问行为进行限制、封禁爬虫的IP地址、登陆时采取图片或滑动验证码等动态验证形式等。因此对滑动验证码的反爬机制进行绕过,使爬虫顺利获取数据源的内容显得尤为重要。
实现思路