本申请提供了一种用于数字地球的高维数据检索方法、设备及介质,属于数字地球技术领域。该方法基于预先搭建的数字地球模型及预设数据划分属性,确定动态模型数据;将动态模型数据输入预先训练的数据转换模型以转换为若干第一高维位向量数据集;根据预设降维算法对各第一高维位向量数据集进行降维处理,得到相应低维数据集;当接收到来自用户终端的待检索数据之后,将待检索数据进行降维处理,以确定与降维处理后的待检索数据对应的一个或多个查询标签;基于查询标签与各低维数据集的匹配操作,确定一个或多个匹配低维数据集,以根据匹配低维数据集关联的原始标签,确定查询标签对应的目标原始标签,并将目标原始标签发送至用户终端。
背景技术
在数字地球领域中,通常涉及对物理世界中复杂的系统进行建模和仿真,并生成大量的高维数据。而高维数据集在数字地球中通常需要更多的存储空间,被处理时也需要更复杂的算法和更高复杂度的计算;且高维数据集在高维空间中难以直观地展示和理解,很难可视化为图像和图形;又由于维数的增加,数据稀疏度减少导致对于高维数据集数据的提取和检索也变得尤为困难。
当今,数据集以指数级增长,然而互联网带宽和存储设备的资源仍有限,为了更高效地利用有限的资源,需要将数据进行压缩,以减少传输和存储的开销,此时如何高效快速检索也变得尤为重要。目前,传统的相似度搜索方法需要在查询时间内逐个比较数据集中内容,应用在上述这种大规模数据集上,这无疑带来很高的计算成本和需要极大的存储空间,还将影响用户查询使用体验。
基于此,亟需一种能够利用有效资源,高效地实现对高维数据检索的技术方案。
实现思路