一种面向含异常值的不确定数据目标分类方法及系统技术方案

技术编号:38996292 阅读:12 留言:0更新日期:2023-10-07 10:27
本发明专利技术提供一种面向含异常值的不确定数据目标分类方法及系统,包括:获取含异常值的不确定数据;将不确定数据输入到异常属性检测模型,获得第一生成矩阵,并根据第一生成矩阵中各个生成值与对应的属性值之间的重构误差以及设定阈值获得不确定数据中异常属性的位置,生成掩码矩阵;利用掩码矩阵和随机噪声矩阵对不确定数据进行异常值替换,获得替换数据,并将替换数据输入到异常属性修正模型,获得第二生成矩阵;利用掩码矩阵和第二生成矩阵对不确定数据进行异常值替换,获得修正数据,并将修正数据输入到目标分类器中,得到不确定数据对应的目标分类结果。本发明专利技术实现了对不确定数据中具体异常属性值的检测与修正,提升了目标识别的准确率。目标识别的准确率。目标识别的准确率。

【技术实现步骤摘要】
一种面向含异常值的不确定数据目标分类方法及系统


[0001]本专利技术属于目标识别
,更具体地,涉及一种面向含异常值的不确定数据目标分类方法及系统。

技术介绍

[0002]目标识别技术在态势分析、环境监测等军事和民用领域发挥着重要作用。但是由于外界条件的影响,传感器传输得到的数据会存在一定错误,部分属性值会出现偏差。若事先不对含有异常属性的数据信息进行处理而直接进行识别,则会严重影响目标识别性能,导致目标识别的准确率很低。
[0003]现行的不完备数据分类方法是在已知缺失值位置的条件下实现对缺失值的填补后,再对数据进行分类的,此方法的前提是已知缺失值的具体位置信息。然而,许多应用中,数据信息出现错误的位置是随机的,因此事先并不清楚哪一维属性会发生错误,这就使得现行的不完备数据分类方法不能直接处理异常数据信息。因此,在不确定数据中异常的具体位置未知的情况下,如何处理不确定数据再进一步做分类处理,以提升目标识别的准确率,成为了目标识别领域亟待解决的重要课题。

技术实现思路

[0004]针对现有技术的缺陷,本专利技术的目的在于提供一种面向含异常值的不确定数据目标分类方法及系统,旨在解决在不确定数据中异常的具体位置未知的情况下,如何处理不确定数据再进一步做分类处理,以提升目标识别的准确率的问题。
[0005]为实现上述目的,第一方面,本专利技术提供了一种面向含异常值的不确定数据目标分类方法,包括:
[0006]S101获取含异常值的不确定数据;所述不确定数据包括各个属性维度的属性值;
[0007]S102将所述不确定数据输入到异常属性检测模型,获得不确定数据对应的第一生成矩阵,并根据第一生成矩阵中各个生成值与对应的属性值之间的重构误差以及设定阈值获得不确定数据中异常属性的位置,根据不确定数据中异常属性的位置生成掩码矩阵;
[0008]S103利用所述掩码矩阵和随机噪声矩阵对不确定数据进行异常值替换,获得替换数据,并将替换数据输入到异常属性修正模型,获得不确定数据对应的第二生成矩阵;
[0009]S104利用所述掩码矩阵和第二生成矩阵对不确定数据进行异常值替换,获得修正数据,并将修正数据输入到目标分类器中,得到所述不确定数据对应的目标分类结果。
[0010]在一个可选的示例中,所述异常属性检测模型的损失函数值基于无标签样本中各个属性维度的输入值与生成值之间的加权均方误差,以及无标签样本对应的先验高斯分布与后验高斯分布之间的KL散度确定。
[0011]在一个可选的示例中,所述异常属性修正模型是基于有标签样本,联合判别器和分类器训练得到的;
[0012]所述异常属性修正模型的损失函数值基于有标签样本对应的KL散度损失、重构误
差损失、判别器损失、L2正则化项以及分类器的交叉熵损失确定。
[0013]在一个可选的示例中,所述异常属性检测模型由第一变分自编码器和第一双向长短时记忆网络组成;所述异常属性修正模型由第二变分自编码器和第二双向长短时记忆网络组成。
[0014]第二方面,本专利技术提供了一种面向含异常值的不确定数据目标分类系统,包括:
[0015]数据获取模块,用于获取含异常值的不确定数据;所述不确定数据包括各个属性维度的属性值;
[0016]异常属性检测模块,用于将所述不确定数据输入到异常属性检测模型,获得不确定数据对应的第一生成矩阵,并根据第一生成矩阵中各个生成值与对应的属性值之间的重构误差以及设定阈值获得不确定数据中异常属性的位置,根据不确定数据中异常属性的位置生成掩码矩阵;
[0017]异常属性修正模块,用于利用所述掩码矩阵和随机噪声矩阵对不确定数据进行异常值替换,获得替换数据,并将替换数据输入到异常属性修正模型,获得不确定数据对应的第二生成矩阵;
[0018]目标分类模块,用于利用所述掩码矩阵和第二生成矩阵对不确定数据进行异常值替换,获得修正数据,并将修正数据输入到目标分类器中,得到所述不确定数据对应的目标分类结果。
[0019]在一个可选的示例中,所述异常属性检测模块中应用的异常属性检测模型的损失函数值基于无标签样本中各个属性维度的输入值与生成值之间的加权均方误差,以及无标签样本对应的先验高斯分布与后验高斯分布之间的KL散度确定。
[0020]在一个可选的示例中,所述异常属性修正模块中应用的异常属性修正模型是基于有标签样本,联合判别器和分类器训练得到的;
[0021]所述异常属性修正模型的损失函数值基于有标签样本对应的KL散度损失、重构误差损失、判别器损失、L2正则化项以及分类器的交叉熵损失确定。
[0022]在一个可选的示例中,所述异常属性检测模块中应用的异常属性检测模型由第一变分自编码器和第一双向长短时记忆网络组成;所述异常属性修正模块中应用的异常属性修正模型由第二变分自编码器和第二双向长短时记忆网络组成。
[0023]总体而言,通过本专利技术所构思的以上技术方案与现有技术相比,具有以下有益效果:
[0024]本专利技术提供一种面向含异常值的不确定数据目标分类方法及系统,通过先利用异常属性检测模型对出现异常的不确定数据信息进行异常属性检测,再利用异常属性修正模型进行异常属性修正,实现了对具体异常属性值的检测与修正,提升了数据的真实性和可靠性,在此基础上再利用目标分类器对修正数据进行分类处理,有效提升了分类器对异常数据的分类能力,提升了目标识别的准确率。
附图说明
[0025]图1是本专利技术提供的不确定数据目标分类方法的流程示意图之一;
[0026]图2是本专利技术提供的异常属性检测模型的结构示意图;
[0027]图3是本专利技术提供的异常属性修正模型的训练示意图;
[0028]图4是本专利技术提供的不确定数据目标分类方法的流程示意图之二;
[0029]图5是本专利技术提供的不确定数据异常检测与修正方法的网络框架;
[0030]图6是本专利技术提供的不确定数据目标分类系统的架构图。
具体实施方式
[0031]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。
[0032]目前常见的异常检测方法大多可以检测出出现异常的整条数据,但是忽视了对具体异常属性值的检测,即无法知道具体出现异常的属性的位置信息。因此有必要对出现异常的数据信息进行异常属性检测与修正后再进一步做分类处理,以提升目标识别的准确率。
[0033]对此,本专利技术提供一种面向含异常值的不确定数据目标分类方法,以解决目标识别中因目标特征数据出现异常错误而导致目标分类错误的问题。图1是本专利技术提供的不确定数据目标分类方法的流程示意图之一,如图1所示,该方法包括:
[0034]步骤S101,获取含异常值的不确定数据;不确定数据包括各个属性维度的属性值;
[0035]步骤S102,将不确定数据输入到异常属性检测模型,获得不确定数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向含异常值的不确定数据目标分类方法,其特征在于,包括:S101获取含异常值的不确定数据;所述不确定数据包括各个属性维度的属性值;S102将所述不确定数据输入到异常属性检测模型,获得不确定数据对应的第一生成矩阵,并根据第一生成矩阵中各个生成值与对应的属性值之间的重构误差以及设定阈值获得不确定数据中异常属性的位置,根据不确定数据中异常属性的位置生成掩码矩阵;S103利用所述掩码矩阵和随机噪声矩阵对不确定数据进行异常值替换,获得替换数据,并将替换数据输入到异常属性修正模型,获得不确定数据对应的第二生成矩阵;S104利用所述掩码矩阵和第二生成矩阵对不确定数据进行异常值替换,获得修正数据,并将修正数据输入到目标分类器中,得到所述不确定数据对应的目标分类结果。2.根据权利要求1所述的方法,其特征在于,所述异常属性检测模型的损失函数值基于无标签样本中各个属性维度的输入值与生成值之间的加权均方误差,以及无标签样本对应的先验高斯分布与后验高斯分布之间的KL散度确定。3.根据权利要求1所述的方法,其特征在于,所述异常属性修正模型是基于有标签样本,联合判别器和分类器训练得到的;所述异常属性修正模型的损失函数值基于有标签样本对应的KL散度损失、重构误差损失、判别器损失、L2正则化项以及分类器的交叉熵损失确定。4.根据权利要求1至3任一项所述的方法,其特征在于,所述异常属性检测模型由第一变分自编码器和第一双向长短时记忆网络组成;所述异常属性修正模型由第二变分自编码器和第二双向长短时记忆网络组成。5.一种面向含异常值的不确定数据目标分类系统,其特征在于,包括:数据获取模块,用于获取...

【专利技术属性】
技术研发人员:马琳婧胡旭辉刘颢蒲宇清
申请(专利权)人:中国船舶集团有限公司第七〇九研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1