数据处理方法、数据检测方法、装置及电子设备制造方法及图纸

技术编号:37545527 阅读:11 留言:0更新日期:2023-05-12 16:17
本申请提供一种数据处理方法、数据检测方法、装置及电子设备,其中,由终端执行的数据处理方法包括:根据待处理数据集,确定检测索引信息;至少利用预设密钥集中的公钥对待处理数据集进行处理,得到加密检测索引信息,所述公钥基于加法同态加密算法生成;将所述加密检测索引信息发送给服务器。本申请能够实现在数据加密情况下的数据污染检测,减少数据检测的系统开销。统开销。统开销。

【技术实现步骤摘要】
数据处理方法、数据检测方法、装置及电子设备


[0001]本申请实施例涉及数据处理
,尤其涉及一种数据处理方法、数据检测方法、装置及电子设备。

技术介绍

[0002]随着数据时代的到来,数据已经成为企业与个人的重要资产。一旦数据被污染而异常,将会导致数据的失真,从而使许多应用场景存在数据安全隐患。
[0003]目前,云端存储的数据通常为明文数据,因此对数据的异常检测手段通常基于明文数据。但是,实际应用中,为了数据的安全性,云端存储的数据可能是加密后的密文数据,针对密文数据的异常检测方法和异常检测标准通常与针对明文数据的异常检测方法和异常检测标准不能通用,这就导致在云端的数据被加密的情况下,无法准确获取数据的异常情况,存在安全隐患。

技术实现思路

[0004]本申请实施例的目的在于提供一种数据处理方法、数据检测方法、装置及电子设备,解决了现有技术中数据检测准确性较低的问题。
[0005]为了解决上述问题,第一方面,本申请实施例提供一种数据处理方法,由终端执行,所述方法包括:
[0006]根据待处理数据集,确定检测索引信息;
[0007]至少利用预设密钥集中的公钥对待处理数据集进行处理,得到加密检测索引信息,所述公钥基于加法同态加密算法生成;
[0008]将所述加密检测索引信息发送给服务器。
[0009]可选地,所述加法同态加密算法为Paillier加密算法。
[0010]可选地,所述根据待处理数据集,确定检测索引信息,包括:
[0011]对所述待处理数据集进行分类,得到I个分类数据集,并确定每个所述分类数据集对应的分类标签,I为正整数;
[0012]根据第一分类数据集中数据的期望和方差中的至少一项,确定所述第一分类数据集对应的第一检测参数集,第一分类数据集为所述I个分类数据集中任一个分类数据集;
[0013]根据所述I个分类数据集分别对应的I个第一检测参数集和I个分类标签,确定检测索引,所述检测索引信息包括所述检测索引。
[0014]可选地,所述根据第一分类数据集中数据的期望和方差中的至少一项,确定所述第一分类数据集对应的第一检测参数集,包括:
[0015]在第一分类数据集中确定第一数据集,所述第一数据集中第一数据的数量占比处于第一占比范围内,所述第一数据满足第一条件;
[0016]根据所述第一数据集中每个数据的期望和方差,确定所述第一分类数据集对应的第一检测参数集。
[0017]可选地,所述预设密钥集还包括伪随机函数;所述至少利用预设密钥集中的公钥对待处理数据集进行处理,得到加密检测索引信息之前,所述方法还包括:
[0018]根据所述第一分类数据集中每个数据的期望和方差,确定所述第一分类数据集对应的第二检测参数集;
[0019]所述至少利用预设密钥集中的公钥对待处理数据集进行处理,得到加密检测索引信息,包括:
[0020]利用所述伪随机函数对所述第一分类数据集对应的第二检测参数集进行处理,得到加密检测参数集;
[0021]根据所述I个分类数据集对应的I个加密检测参数集,确定目标矢量,所述目标矢量为基于所述I个加密检测参数集生成的第一多项式的系数矢量;
[0022]利用所述公钥对所述目标矢量进行加密,得到加密检测索引,所述加密检测索引信息包括所述加密检测索引。
[0023]可选地,所述根据所述I个分类数据集对应的I个加密检测参数集,确定目标矢量,包括:
[0024]对所述I个分类数据集对应的I个加密检测参数集中,每个所述加密检测参数集进行随机数填充,得到I个目标检测参数集,每个所述目标检测参数集中检测参数的个数相等;
[0025]根据所述I个目标检测参数集,生成所述第一多项式;
[0026]将所述第一多项式的系数矢量确定为所述目标矢量;
[0027]其中,所述第一多项式为:
[0028][0029]其中,∑为所述I个加密检测参数集组成的集合,m
i
为第i类分类数据集对应的加密检测参数集,i∈I;R为随机数集合,r
j
为R中的第j个随机数,
[0030]可选地,所述预设密钥集还包括伪随机函数和可逆矩阵;所述至少利用预设密钥集中的公钥对待处理数据集进行处理,得到加密检测索引信息,包括:
[0031]根据所述第一分类数据集中每个数据的期望和方差,确定第二检测参数集;
[0032]利用所述伪随机函数对所述第一分类数据集对应的第二检测参数集进行处理,得到加密检测参数集;
[0033]对所述I个分类数据集对应的I个加密检测参数集中,每个所述加密检测参数集进行随机数填充,得到I个目标检测参数集,每个所述目标检测参数集中检测参数的个数相等;
[0034]根据所述I个目标检测参数集,构建检测矩阵;
[0035]利用所述可逆矩阵对所述检测矩阵进行处理,得到加密检测矩阵,所述加密检测索引信息包括所述加密检测矩阵。
[0036]可选地,所述预设密钥集还包括伪随机函数;所述对所述待处理数据进行分类,得到I个分类数据集,并确定每个所述分类数据集对应的分类标签之后,所述方法还包括:
[0037]利用所述伪随机函数对所述I个分类数据集对应的I个分类标签进行处理,得到I
个加密分类标签。
[0038]可选地,所述方法还包括:
[0039]对所述待处理数据进行分类,得到I个分类数据集,并确定每个所述分类数据集对应的分类标签,I为正整数;
[0040]在第一分类数据集中确定第二数据集,所述第一分类数据集为所述I个分类数据集中的任一分类数据集,所述第二数据集中第一数据的数量占比处于第二占比范围,所述第二数据集中第二数据的数量占比处于第三占比范围,所述第一数据满足第一条件,所述第二数据满足第二条件;
[0041]计算所述第二数据集中数据的F值;
[0042]根据所述F值,确定所述第一分类数据集对应的异常判定阈值,所述异常判定阈值用于对与第一分类标签对应的数据进行异常检测,所述第一分类标签为所述第一分类数据集对应的分类标签。
[0043]可选地,所述根据所述F值,确定所述第一分类数据集对应的异常判定阈值之后,所述方法还包括:
[0044]在所述第一分类数据集中确定第三数据集,所述第三数据集中第一数据的数量占比处于第四占比范围,所述第三数据集中所述第二数据的数量占比处于第五占比范围;
[0045]根据所述第三数据集,对所述异常判定阈值进行测试;
[0046]其中,在所述异常判定阈值测试通过的情况下,将所述异常判定阈值用于对与所述第一分类标签对应的数据进行异常检测。
[0047]第二方面,本申请实施例提供了一种数据检测方法,由终端执行,所述方法包括:
[0048]根据待检测数据集中每个数据对应的分类标签,确定所述待检测数据集的检测令牌;
[0049]向服务器发送数据检测请求,所述数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,由终端执行,所述方法包括:根据待处理数据集,确定检测索引信息;至少利用预设密钥集中的公钥对待处理数据集进行处理,得到加密检测索引信息,所述公钥基于加法同态加密算法生成;将所述加密检测索引信息发送给服务器。2.根据权利要求1所述的方法,其特征在于,所述加法同态加密算法为Paillier加密算法。3.根据权利要求1所述的方法,其特征在于,所述根据待处理数据集,确定检测索引信息,包括:对所述待处理数据集进行分类,得到I个分类数据集,并确定每个所述分类数据集对应的分类标签,I为正整数;根据第一分类数据集中数据的期望和方差中的至少一项,确定所述第一分类数据集对应的第一检测参数集,第一分类数据集为所述I个分类数据集中任一个分类数据集;根据所述I个分类数据集分别对应的I个第一检测参数集和I个分类标签,确定检测索引,所述检测索引信息包括所述检测索引。4.根据权利要求3所述的方法,其特征在于,所述根据第一分类数据集中数据的期望和方差中的至少一项,确定所述第一分类数据集对应的第一检测参数集,包括:在第一分类数据集中确定第一数据集,所述第一数据集中第一数据的数量占比处于第一占比范围内,所述第一数据满足第一条件;根据所述第一数据集中每个数据的期望和方差,确定所述第一分类数据集对应的第一检测参数集。5.根据权利要求3所述的方法,其特征在于,所述预设密钥集还包括伪随机函数;所述至少利用预设密钥集中的公钥对待处理数据集进行处理,得到加密检测索引信息之前,所述方法还包括:根据所述第一分类数据集中每个数据的期望和方差,确定所述第一分类数据集对应的第二检测参数集;所述至少利用预设密钥集中的公钥对待处理数据集进行处理,得到加密检测索引信息,包括:利用所述伪随机函数对所述第一分类数据集对应的第二检测参数集进行处理,得到加密检测参数集;根据所述I个分类数据集对应的I个加密检测参数集,确定目标矢量,所述目标矢量为基于所述I个加密检测参数集生成的第一多项式的系数矢量;利用所述公钥对所述目标矢量进行加密,得到加密检测索引,所述加密检测索引信息包括所述加密检测索引。6.根据权利要求5所述的方法,其特征在于,所述根据所述I个分类数据集对应的I个加密检测参数集,确定目标矢量,包括:对所述I个分类数据集对应的I个加密检测参数集中,每个所述加密检测参数集进行随机数填充,得到I个目标检测参数集,每个所述目标检测参数集中检测参数的个数相等;根据所述I个目标检测参数集,生成所述第一多项式;
将所述第一多项式的系数矢量确定为所述目标矢量;其中,所述第一多项式为:其中,∑为所述I个加密检测参数集组成的集合,m
i
为第i类分类数据集对应的加密检测参数集,i∈I;R为随机数集合,r
j
为R中的第j个随机数,7.根据权利要求3所述的方法,其特征在于,所述预设密钥集还包括伪随机函数和可逆矩阵;所述至少利用预设密钥集中的公钥对待处理数据集进行处理,得到加密检测索引信息,包括:根据所述第一分类数据集中每个数据的期望和方差,确定第二检测参数集;利用所述伪随机函数对所述第一分类数据集对应的第二检测参数集进行处理,得到加密检测参数集;对所述I个分类数据集对应的I个加密检测参数集中,每个所述加密检测参数集进行随机数填充,得到I个目标检测参数集,每个所述目标检测参数集中检测参数的个数相等;根据所述I个目标检测参数集,构建检测矩阵;利用所述可逆矩阵对所述检测矩阵进行处理,得到加密检测矩阵,所述加密检测索引信息包括所述加密检测矩阵。8.根据权利要求3所述的方法,其特征在于,所述预设密钥集还包括伪随机函数;所述对所述待处理数据进行分类,得到I个分类数据集,并确定每个所述分类数据集对应的分类标签之后,所述方法还包括:利用所述伪随机函数对所述I个分类数据集对应的I个分类标签进行处理,得到I个加密分类标签。9.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所述待处理数据进行分类,得到I个分类数据集,并确定每个所述分类数据集对应的分类标签,I为正整数;在第一分类数据集中确定第二数据集,所述第一分类数据集为所述I个分类数据集中的任一分类数据集,所述第二数据集中第一数据的数量占比处于第二占比范围,所述第二数据集中第二数据的数量占比处于第三占比范围,所述第一数据满足第一条件,所述第二数据满足第二条件;计算所述第二数据集中数据的F值;根据所述F值,确定所述第一分类数据集对应的异常判定阈值,所述异常判定阈值用于对与第一分类标签对应的数据进行异常检测,所述第一分类标签为所述第一分类数据集对应的分类标签。10.根据权利要求9所述的方法,其特征在于,所述根据所述F值,确定所述第一分类数据集对应的异常判定阈值之后,所述方法还包括:在所述第一分类数据集中确定第三数据集,所述第三数据集中第一数据的数量占比处于第四占比范围,所述第三数据集中所述第二数据的数量占比处于第五占比范围;根据所述第三数据集,对所述异常判定阈值进行测试;
其中,在所述异常判定阈值测试通过的情况下,将所述异常判定阈值用于对与所述第一分类标签对应的数据进行异常检测。11.一种数据检测方法,其特征在于,由终端执行,所述方法包括:根据待检测数据集中每个数据对应的分类标签,确定所述待检测数据集的检测令牌;向服务器发送数据检测请求,所述数据检测请求携带有所述检测令牌;接收所述服务器发送的检测信息,所述检测信息由所述服务器基于所述检测令牌和预先获取的加密检测索引信息确定,所述加密检测索引信息为根据权利要求1至10中任一项所述的方法获取的加密检测索引信息;利用预设密钥集中的私钥对所述检测信息进行解密,得到所述待检测数据集对应的检测参数集,所述私钥基于加法同态...

【专利技术属性】
技术研发人员:郭斯栩何申耿慧拯张鑫月
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1