本技术公开了一种用于电驱动系统效率试验数据的数据处理和质量评估方法,包括:获取原始电驱动效率试验数据集;通过基于概率分布的数据降噪法对原始电驱动效率试验数据集进行降噪,得到降噪电驱动效率试验数据集;通过DBSCAN模型对降噪电驱动效率试验数据集进行第一次异常检验和处理,得到初筛电驱动效率试验数据集;通过LOF算法模型和iForest算法模型对初筛电驱动效率试验数据集进行第二次异常检验和处理,得到预处理电驱动效率试验数据集;通过构建的六元组数据质量模型对预处理电驱动效率试验数据集进行质量评估。本发明能够对电驱动系统效率试验数据进行有效的降噪和异常检验,从而提高数据质量。
背景技术
电驱动系统作为电动汽车的动力源,其效率性直接决定着汽车的动力性和经济性。因此电驱动系统效率试验已成为其开发中必不可少的重要环节,但进行电驱动系统试验时会产生大量的高维数据,同时存在大量的噪声和异常值,处理起来十分困难且有效性低。传统的数据预处理方式难以进行准确的处理与评估,导致大量数据堆积,利用率低。
传统的数据处理方法大多基于数学的统计理论,主要应用于小规模、数据关联程度较为明显的样本集的统计分析。对于试验数据量大、数据复杂的样本集利用传统的处理方法处理起来十分困难且有效性低。
针对数据预处理问题,目前常利用数据规约中的降维归一、数据属性聚类、相关性分析等方法,实现数据的压缩和主要影响因素提取。现有技术中,有方案通过主成分分析和皮尔森相关系数分析法提取原始数据中关联度较高数据特征,压缩了数据集提高了效率,但没有充分考虑对异常值的处理。有方案利用核主元分析方法对数据的特征进行提取,但是进行数据特征提取时容易陷入局部解且计算复杂。有方案利用皮尔逊相关系数对电容器的特征参数之间进行了相关性的分析,但是该分析对于非线性分析不够敏感且对异常值的处理较为敏感容易出现失真。有方案利用中位秩的方法对各个挡的转速进行加权来评定直驶模式下稳定的传递效率,但利用该方法会丢失原始数据中的一些信息。
综上所述,如何设计一种能够对电驱动系统效率试验数据进行有效的降噪和异常检验以提高数据质量的方法是亟需解决的技术问题。
实现思路