一种安全多方计算下的异常检测方法技术

技术编号:38233408 阅读:16 留言:0更新日期:2023-07-25 18:00
本发明专利技术公开了一种安全多方计算下的异常检测方法,涉及数据安全领域,包括如下步骤:数据输入,区分数据源分布;针对不同数据源采用不同安全多方计算协议;基于属性值频率异常检测算法进行检测;得出异常点结果。本发明专利技术利用属性值频率估计异常程度,根据不同的数据分布,提出了安全盲排列协议处理数据水平分布下的隐私保护问题和利用多方安全和协议处理数据垂直分布下的隐私保护问题两种安全多方计算的方案。解决了水平分布数据不能做距离计算的问题,减少了交互时的数据量,减少了隐私数据的泄露,同时减少了大量的计算资源。同时减少了大量的计算资源。同时减少了大量的计算资源。

【技术实现步骤摘要】
一种安全多方计算下的异常检测方法


[0001]本专利技术涉及数据安全领域,具体是一种安全多方计算下的异常检测方法。

技术介绍

[0002]随着信息技术的发展,数据来源更加多元化,当数据分布在不同站点,基于法律和隐私层面的考虑,需要设计出对应的隐私保护方案,异常检测和隐私保护是数据分析和数据挖掘领域的重要研究方向。研究中异常检测算法主要分为:基于统计的,基于距离的,基于密度的,基于聚类的和基于隔离的。但大多数这些算法主要针对集中式数据,不能直接应用于分布式的数据集中。在具有很高的查全率和较低的误判率对前提下,基于隐私保护的异常检测需要考虑数据分布和算法效率的问题。
[0003]为了适应数据分布不同的问题,本专利技术提出了基于属性值频率的异常检测方法,利用属性值频率估计异常程度,解决了水平分布数据不能做距离计算的问题。根据不同的数据分布,提出了安全盲排列协议处理数据水平分布下的隐私保护问题和利用多方安全和协议处理数据垂直分布下的隐私保护问题两种安全多方计算的方案。

技术实现思路

[0004]本专利技术的目的在于提供一种安全多方计算下的异常检测方法,以解决上述
技术介绍
中提出的问题。
[0005]为实现上述技术问题的解决,本专利技术的目的在于一种安全多方计算下的异常检测方法,包括如下步骤:
[0006]S1、数据输入,区分数据源分布;
[0007]S2、针对不同数据源采用不同安全多方计算协议;
[0008]S3、基于属性值频率异常检测算法进行检测;
[0009]S4、得出异常点结果。
[0010]优先地,数据输入,区分数据源分布,具体为区分所输入的数据为两种不同数据源分布,分别为水平分布和垂直分布。水平分布数据即分布式同构数据,按照数据对象划分数据集,即不同参与方为不同的数据对象收集相同的属性信息。垂直分布数据即分布式异构数据,按照属性划分数据集,即不同参与方为相同的数据对象收集不同的属性信息。
[0011]优先地,针对不同数据源采用不同安全多方计算协议,具体为采用两种安全多方计算的方案,分别是安全盲排列协议和多方安全和协议。安全盲排列协议处理数据水平分布下的隐私保护问题,利用多方安全和协议处理数据垂直分布下的隐私保护问题。
[0012]优先地,数据源水平分布的情形下,各参与方虽知晓各自数据对象的所有属性,但是在计算同一属性下的属性频率分数时不具全局性,需要参与方联合计算,但出于法律或隐私方面的考虑,参与方不想泄露自身的隐私数据。
[0013]优先地,数据垂直分布的情形下,各参与方联合计算检测异常时,需要保护各参与方的隐私数据。数据垂直分布下,基于AVF的隐私保护异常检测,保护各参与方私有信息的
同时进行联合计算检测异常,并将检测到的异常信息进行共享。
[0014]优先地,基于属性值频率异常检测算法进行检测,具体为利用属性值频率AVF来估计异常程度,当使用适当离散化,AVF可用于连续的数字型数据集。由于异常对象只占全局数据对象的少数,那么某一个数据对象的属性值出现的频率很低,则可能为异常对象。
[0015]优先地,得出异常点结果,具体为经过水平分布下的隐私保护AVF

OD算法,垂直分布下的隐私保护AVF

OD算法以及安全盲排列协议和多方安全和协议,计算得出异常点的结果。
[0016]综上所述,本专利技术提供了一种安全多方计算下的异常检测方法,所述方法包括:数据输入,区分数据源分布;针对不同数据源采用不同安全多方计算协议;基于属性值频率异常检测算法进行检测;得出异常点结果。提出了基于属性值频率的异常检测算法,利用属性值频率估计异常程度,解决了水平分布数据不能做距离计算的问题,减少了交互时的数据量,减少了隐私数据的泄露,减少了大量的计算资源。
附图说明
[0017]图1为安全多方计算下的属性值频率异常检测算法架构图。
具体实施方式
[0018]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行描述。
[0019]实施例1
[0020]如图1所示,本实施例提供了一种安全多方计算下的异常检测方法,包括如下步骤:
[0021]S1、数据输入,区分数据源分布;
[0022]S2、针对不同数据源采用不同安全多方计算协议;
[0023]S3、基于属性值频率异常检测算法进行检测;
[0024]S4、得出异常点结果。
[0025]本实施例中,S1中,数据输入,区分数据源分布的具体方法包括如下步骤:
[0026]区分所输入的数据为两种不同数据源分布,分别为水平分布和垂直分布。
[0027]具体的,水平分布数据即分布式同构数据,按照数据对象划分数据集,即不同参与方为不同的数据对象收集相同的属性信息。
[0028]具体的,以Pi参与方为例,Pi参与方的数据库为DBi,拥有Ni条数据对象,m个属性,则全局数据库DB
i
,拥有个数据对象,m个属性,如表1所示:
[0029]表1数据对象参数与属性关系表
[0030][0031]具体的,垂直分布数据即分布式异构数据,按照属性划分数据集,即不同参与方为相同的数据对象收集不同的属性信息。
[0032]具体的,以Pi参与方为例,Pi参与方的数据库为DBi,拥有N条数据对象,mi个属性,则全局数据库DB,拥有N条数据对象,个属性,如表2所示:
[0033]表2属性参数与数据对象关系表
[0034][0035]本实施例中,S2中,针对不同数据源采用不同安全多方计算协议的具体方法包括如下步骤:
[0036]采用两种安全多方计算的方案,分别是安全盲排列协议和多方安全和协议。
[0037]具体的,盲排列协议BPP,主要是为了破坏数据与数据拥有者的对应关系。假设Alice的一个向量S=(s1,...,s
n
),向量被分为两个加性向量S

=(S
′1,...,S

n
)和S

=(s
″1,...,s

n
),其中S=S

+S

。Bob拥有S=(s1,...,s
n
),Bob无法知晓S和S

中的值。
[0038]输入:Alice拥有的向量S=(s1,...,s
n
)和S

=(S
′1,...,S

n
);
[0039]Bob拥有的向量S

=(s
″1,...,s

n
);
[0040]输出:S

=(S
′1,...,S

N
)和S

=(s
″1,...,s

n...

【技术保护点】

【技术特征摘要】
1.一种安全多方计算下的异常检测方法,其特征在于:包括如下步骤:S1、数据输入,区分数据源分布;S2、针对不同数据源采用不同安全多方计算协议;S3、基于属性值频率异常检测算法进行检测;S4、得出异常点结果。2.根据权利要求1所述的一种安全多方计算下的异常检测方法,其特征在于:所述S1中,区分所输入的数据为两种不同数据源分布。3.根据权利要求2所述的一种安全多方计算下的异常检测方法,其特征在于:所述两种不同的数据分布分别为水平分布和垂直分布。4.根据权利要求3所述的一种安全多方计算下的异常检测方法,其特征在于:所述水平分布数据即分布式同构数据,按照数据对象划分数据集,即不同参与方为不同的数据对象收集相同的属性信息;所述垂直分布数据即分布式异构数据,按照属性划分数据集,即不同参与方为相同的数据对象收集不同的属性信息。5.根据权利要求1所述的一种安全多方...

【专利技术属性】
技术研发人员:张越何兴国赖春媚
申请(专利权)人:广州图灵科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1