一种大数据应用开放平台的隐私计算方法及应用技术

技术编号:30023143 阅读:26 留言:0更新日期:2021-09-11 06:48
本发明专利技术公开了一种大数据应用开放平台的隐私计算方法及应用,包括以下步骤:获取需要进行隐私计算的大数据应用开放平台软件信息,并建立隐私等级参数,同时计算隐私等级参数,将其按照隐私等级进行排序;按照排列的顺序,依次对软件中各项目数据进行模拟操作,本发明专利技术通过对需要进行隐私计算的大数据应用开放平台软件进行模拟活动,从而计算模拟活动中隐私数据出现的概率,并根据软件的性质与作用,确定软件上架的隐私度要求指标,将软件模拟活动中隐私数据出现的概率与软件上架的隐私度要求指标进行对比,从而计算软件是否能够上架大数据应用开放平台,进而保证大数据应用开放平台上的软件对隐私的保护程度,有利于实际的应用。用。用。

【技术实现步骤摘要】
一种大数据应用开放平台的隐私计算方法及应用


[0001]本专利技术属于隐私计算领域,具体为一种大数据应用开放平台的隐私计算方法及应用。

技术介绍

[0002]现有生活中,随着移动互联网的发展,智能终端设备成为用户最主要的沟通工具,很多金融科技的利用依赖于智能终端设备上产生的大量数据,传统的大数据应用依赖于云计算,即在移动终端采集数据,并把这些数据全部上传到集中的云服务器,然后利用大数据、机器学习、人工智能等技术对这些数据加以计算、加工和利用,而随着移动终端上的大数据应用开放平台对个人隐私和数据安全越来越重视,并且移动终端上的大数据应用开放平台获得的数据多为重度个人隐私,这些数据的传输、存储都存在技术或者管理因素可能导致信息泄漏,最终可能导致隐私被非法使用,无论用户个人隐私保护意识还是相关信息保护政策都会要求尽量避免第三方收集传输存储这些隐私数据。
[0003]而现有技术中缺乏一种基于大数据应用开放平台的隐私计算方法,从而导致移动终端设备在大数据应用开放平台上架软件时,无法对这些上架软件的隐私要求进行计算,从而确定其是否符合上架标准,进而导致大数据应用开放平台上的软件对隐私的保护程度参差不齐,不利于实际的应用。

技术实现思路

[0004]本专利技术的目的就在于为了解决上述问题而提供一种大数据应用开放平台的隐私计算方法及应用,解决了
技术介绍
中提到的问题。
[0005]为了解决上述问题,本专利技术提供了一种技术方案:
[0006]一种大数据应用开放平台的隐私计算方法,包括以下步骤:
[0007]S1、获取需要进行隐私计算的大数据应用开放平台软件信息,并建立隐私等级参数,同时计算隐私等级参数,将其按照隐私等级进行排序;
[0008]S2、按照排列的顺序,依次对软件中各项目数据进行模拟操作,进行模拟操作的同时统计操作中需要使用的个人隐私信息;
[0009]S3、根据个人隐私信息出现的次数以及各项目数据操作进行各项目数据隐私度计算;
[0010]S4、对获取的各项目数据隐私度进行数据整合与处理,同时对其进行数据集划分;
[0011]S5、根据划分的数据集分别对软件的整体隐私度H2进行计算;
[0012]S6、根据软件的性质与作用,确定软件上架的隐私度要求指标H1,并将计算得到的软件整体隐私度H2与上架隐私度要求指标H1进行对比,若H1>H2,则软件给予上架,若H1<H2,则软件不予上架。
[0013]作为优选,所述步骤S1中的软件信息包括软件注册基本信息、软件适用设备配置信息、软件登录账户信息、隐私信息、社会关系信息和网络行为信息。
[0014]作为优选,所述步骤S1中的隐私等级参数计算方法包括以下步骤:
[0015]S11、对获得的各项信息中的分项信息进行评估,涉及个人隐私参数的项目标记为1,不涉及个人隐私参数的项目标记为0;
[0016]S12、标记完成之后,对标记之后的数据进行归一化处理,遍历标记的每一个数据,将同一项目数据中标记1的数据量x和标记0的数据量y进行相加,得到所有项目的整体数据信息量n;
[0017]S13、根据不同项目数据计算各项目数据的隐私涉及程度M,M=(x/n)100%;
[0018]S14、比较各项目数据的M值大小,并将其由大到小进行逐一排列。
[0019]作为优选,所述步骤S2中对软件中各项目数据进行模拟操作的具体操作步骤为:
[0020]S21、获取软件中各项目数据在进行操作时的各项活动;
[0021]S22、根据获取的各项活动,通过操作步骤以及操作语义调取软件中对应的各项构件;
[0022]S23、根据各项活动的具体操作步骤与执行各步骤需要使用的各项构件,获取各项目数据在进行操作时的活动路径。
[0023]作为优选,所述步骤S3中各项目数据隐私度计算的具体操作步骤为:
[0024]S31、根据步骤S23中得到的各项目数据在进行操作时的活动路径,进行项目执行操作,并按照执行要求录入相应的数据;
[0025]S32、根据进行的项目执行操作,获取操作中使用的各项数据,并按照数据中的标记,识别涉及个人隐私的数据参数与不涉及个人隐私的数据参数,并将涉及个人隐私的数据参数记为A1,将不涉及个人隐私的数据参数记为A2;
[0026]S33、同时统计各项目执行操作在进行时,A1出现的次数D以及A2出现的次数E;
[0027]S34、计算各项目执行操作在进行时,A1出现的概率K,K=【D/(D+E)】100%,K即为各项目数据隐私度。
[0028]作为优选,所述步骤S4中的数据整合与处理的具体操作步骤为:
[0029]S41、对步骤S34中计算得到的各项目数据隐私度K1、K2、K3
……
Kn进行获取;
[0030]S42、当各项目数据隐私度之间出现一个或者多个项目缺失时,返回上述步骤S3,重新对该项目数据隐私度进行计算,从而对缺失值数据进行填充;
[0031]S43、数据填充完成之后,按照由小到大的排列顺序对数据隐私度进行排列;
[0032]S44、去除各项目数据隐私度K1、K2、K3
……
Kn中的最大值与最小值。
[0033]作为优选,所述步骤S4中的数据集划分是将步骤S44中得到的去除最大值与最小值之后K1、K2、K3
……
Kn划分为代表集和误差集,即将各项目数据隐私度按照不平衡比例以8:2随机划分为两份,从数据隐私度排列样本中段抽取80%作为代表集样本,其余的作为误差集样本。
[0034]作为优选,所述步骤S5中对软件的整体隐私度H2进行计算的具体操作步骤为:
[0035]S51、将步骤S4中得到的代表集样本各项数据进行相加,然后除以代表集样本数据量I1,得到代表集样本数据整体隐私度H2(1),H2(1)=【K(n

2)、K(n

1)
……
K(n+n)】/I1;
[0036]S52、将步骤S4中得到的误差集样本各项数据进行相加,然后除以代表集样本数据量I2,得到代表集样本数据整体隐私度H2(2),H2(2)=【K(n

2)、K(n

1)
……
K(n+n)】/I2;
[0037]S53、将步骤S51中得到的H2(1)与步骤S52中得到的H2(2)相加再除以2即得软件整
体隐私度H2,H2=【H2(1)+H2(2)】/2。
[0038]所述的隐私计算方法能用于评估大数据应用开放平台软件是否符合上架标准。
[0039]本专利技术的有益效果是:本专利技术通过对需要进行隐私计算的大数据应用开放平台软件进行模拟活动,从而计算模拟活动中隐私数据出现的概率,并根据软件的性质与作用,确定软件上架的隐私度要求指标,将软件模拟活动中隐私数据出现的概率与软件上架的隐私度要求指标进行对比,从而计算软件是否能本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种大数据应用开放平台的隐私计算方法,其特征在于,包括以下步骤:S1、获取需要进行隐私计算的大数据应用开放平台软件信息,并建立隐私等级参数,同时计算隐私等级参数,将其按照隐私等级进行排序;S2、按照排列的顺序,依次对软件中各项目数据进行模拟操作,进行模拟操作的同时统计操作中需要使用的个人隐私信息;S3、根据个人隐私信息出现的次数以及各项目数据操作进行各项目数据隐私度计算;S4、对获取的各项目数据隐私度进行数据整合与处理,同时对其进行数据集划分;S5、根据划分的数据集分别对软件的整体隐私度H2进行计算;S6、根据软件的性质与作用,确定软件上架的隐私度要求指标H1,并将计算得到的软件整体隐私度H2与上架隐私度要求指标H1进行对比,若H1>H2,则软件给予上架,若H1<H2,则软件不予上架。2.根据权利要求1所述的一种大数据应用开放平台的隐私计算方法,其特征在于,所述步骤S1中的软件信息包括软件注册基本信息、软件适用设备配置信息、软件登录账户信息、隐私信息、社会关系信息和网络行为信息。3.根据权利要求1所述的一种大数据应用开放平台的隐私计算方法,其特征在于,所述步骤S1中的隐私等级参数计算方法包括以下步骤:S11、对获得的各项信息中的分项信息进行评估,涉及个人隐私参数的项目标记为1,不涉及个人隐私参数的项目标记为0;S12、标记完成之后,对标记之后的数据进行归一化处理,遍历标记的每一个数据,将同一项目数据中标记1的数据量x和标记0的数据量y进行相加,得到所有项目的整体数据信息量n;S13、根据不同项目数据计算各项目数据的隐私涉及程度M,M=(x/n)100%;S14、比较各项目数据的M值大小,并将其由大到小进行逐一排列。4.根据权利要求1所述的一种大数据应用开放平台的隐私计算方法,其特征在于,所述步骤S2中对软件中各项目数据进行模拟操作的具体操作步骤为:S21、获取软件中各项目数据在进行操作时的各项活动;S22、根据获取的各项活动,通过操作步骤以及操作语义调取软件中对应的各项构件;S23、根据各项活动的具体操作步骤与执行各步骤需要使用的各项构件,获取各项目数据在进行操作时的活动路径。5.根据权利要求4所述的一种大数据应用开放平台的隐私计算方法,其特征在于,所述步骤S3中各项目数据隐私度计算的具体操作步骤为:S31、根据步骤S23中得到的各项目数据在进行操作时的活动路径,进行项目执行操作,并按照执行要求录入相应的数据;S32、根据进行的项目执行操作,获取操作中使用的各项数据,并按照数据中的标记,识别涉及个人隐私的数据参数与不涉及个人隐私的数...

【专利技术属性】
技术研发人员:顾冉叶薇薇
申请(专利权)人:杭州煋辰数智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1