一种用于药品数据库的数据处理方法
2025-02-24 09:31
No.1343515701692080128
技术概要
PDF全文
本技术涉及数据处理领域,更具体地,本发明涉及一种用于药品数据库的数据处理方法,方法包括:获取药品数据集,所述药品数据集中包含若干药品数据;获取任一药品数据的预设邻域数据;将邻域数据聚类成若干聚类簇;计算各邻域数据的参考权重;以各邻域数据的参考权重为权重,利用LOF算法计算该药品数据的局部可达密度;基于局部可达密度利用LOF算法进行异常检测,以去除药品数据库中的异常数据。通过分析药品数据与各邻域数据属于同一类别的程度,给各邻域数据设置不同的权重,来提高异常检测的准确性。
背景技术
药品数据库中药品数据一般是通过人为录入或者是二维码识别的方式进行录入,无论是二维码识别还是人为录入,都会出现错误。为了防止这种错误影响到后续环节,需将药品数据库中的异常数据筛选出来。 药品数据一般呈类簇分布,例如一些治疗同类病症的多种药品,其药品数据具有相似特征,因而这种治疗同类病症的多种药品的数据会分布在同一类簇中。由于异常数据中存在错误信息,因而异常数据与所属类簇的其他数据的相似性降低,从而呈现出偏离所属类簇的特征。 局部异常因子算法(Local Outlier Factor,简称LOF)在进行异常检测时,是根据数据所在邻域内的数据密度偏离邻域内其他数据的数据密度的情况来反映数据的异常程度。该算法在计算数据密度时,是利用数据与邻域内各数据的距离的平均情况来反映数据密度。这种计算方法没有考虑数据的类簇特征,例如当数据处于类簇边缘时,该数据的邻域内包含多个种类的数据,由于该数据与其他类簇的距离较大,因而通过该数据与邻域内数据距离的平均情况计算出的数据密度应该较小,通过该方式计算出的数据密度,很容易将该数据判定为异常数据。而实际上该数据并没有明显偏离所属类簇,因而该数据并不是异常数据。利用传统LOF算法进行异常检测,很容易出现异常误判。因而如何通过考虑数据的类簇特征,实现准确的异常检测成为本发明的研究重点。 公开号为CN115292385A的专利申请文件中公开了一种基于LOF算法的个性化定制订单异常检测系统,该专利申请文件中仅仅使用LOF算法进行异常检测,没有考虑数据的类簇特征,因而该专利申请文件中方法不适用于解决本发明中问题。
实现思路
阅读余下40%
技术概要为部分技术内容,查看PDF获取完整资料
该技术已申请专利,如用于商业用途,请联系技术所有人!
技术研发人员:
李骥
技术所属: 易迪希医药科技(嘉兴)有限公司.
相关技术
一种服务开发方法、装置、设备及存储介质 一种服务开发方法、装置、设备及存储介质
一种高精度双层优化方法的神经网络搜索架构构建方法 一种高精度双层优化方法的神经网络搜索架构构建方法
跨总线域的设备对宿主机空间DMA访问方法及相关设备 跨总线域的设备对宿主机空间DMA访问方法及相关设备
一种客户信息定期维护方法及系统 一种客户信息定期维护方法及系统
代码发布方法、装置、计算机设备和可读存储介质 代码发布方法、装置、计算机设备和可读存储介质
一种基于统一管理平台的子应用数据获取方法及装置 一种基于统一管理平台的子应用数据获取方法及装置
利用深度学习的BIM模型错误自动检测系统 利用深度学习的BIM模型错误自动检测系统
一种基于智能反射面的室内T型走廊场景路径损耗的分析方法 一种基于智能反射面的室内T型走廊场景路径损耗的分析方法
模型评估任务处理方法及装置 模型评估任务处理方法及装置
基于大数据的异常信号智能识别方法 基于大数据的异常信号智能识别方法
技术分类
电信、广播电视和卫星传输服务 电信、广播电视和卫星传输服务
互联网软件服务 互联网软件服务
集成电路设计 集成电路设计
信息集成数字服务 信息集成数字服务
电气机械制造 电气机械制造
计算机、通信、电子设备制造 计算机、通信、电子设备制造
医药制造、生物基材料 医药制造、生物基材料
石油煤矿化学用品加工 石油煤矿化学用品加工
化学原料制品加工 化学原料制品加工
非金属矿物加工 非金属矿物加工
金属制品加工 金属制品加工
专用设备制造 专用设备制造
通用设备制造 通用设备制造
通用零部件制造 通用零部件制造
汽车制造业 汽车制造业
铁路、船舶、航天设备制造 铁路、船舶、航天设备制造
电力、热力生产和供应 电力、热力生产和供应
燃气生产和供应 燃气生产和供应
水生产和供应 水生产和供应
房屋建筑、土木工程 房屋建筑、土木工程
交通运输、仓储和邮政 交通运输、仓储和邮政
农、林、牧、渔业 农、林、牧、渔业
采矿业 采矿业
农副、食品加工 农副、食品加工
烟草、酒水加工 烟草、酒水加工
纺织皮具居家制品 纺织皮具居家制品
文教体娱加工 文教体娱加工
苏ICP备18062519号-5 © 2018-2025 【123技术园】 版权所有,并保留所有权利