海量用户系统中具有隐私保护的特征用户发现与统计方法技术方案

技术编号:19638160 阅读:29 留言:0更新日期:2018-12-01 18:30
本发明专利技术公开了一种海量用户系统中具有隐私保护的特征用户发现与统计方法,本发明专利技术将目标特征属性集转换为目标特征值、将用户私有属性集转换为用户的一系列属性特征值,通过目标特征值和用户的特征值统计目标特征用户的用户数。为了在保护用户隐私的条件下实现在海量用户中统计具有目标特征属性集的用户数,本发明专利技术利用同态加密算法加密用户私有属性集对应的一系列属性特征值,通过密文级上的用户特征值的相关运算统计出目标特征用户的用户数。根据获得的统计值还可以分析发现各种特征用户在海量用户中的分布情况。本发明专利技术有效地解决了如何在不泄漏用户隐私的条件下高效发现和统计海量用户系统中的特征用户的问题。

【技术实现步骤摘要】
海量用户系统中具有隐私保护的特征用户发现与统计方法
本专利技术属于信息安全
,具体涉及一种海量用户系统中具有隐私保护的特征用户发现与统计方法。
技术介绍
在电子商务领域中,为了制定合理的营销策略,电子商务公司需要了解具有不同购物习惯的用户在其用户群体中的分布情况;在电子医疗领域中,为了掌握我国各种疾病的分布情况,医疗部门需要了解患有不同疾病的患者在所有患者中的分布情况;在电子政务领域中,为了获得人口结构情况,政府部门需要了解不同年龄段人在人口中的分布情况;在舆情管理中,为了全面掌握舆情情况,监管部门需要了解群众对社会事件持有态度的分布情况等等,这些实际应用说明特征用户在用户中的分布情况具有重要的应用价值。此外,在另一些应用需求中,需要在用户群体中发现指定特征的用户,例如在保险领域中,为了评估某疾病是否能参保或明确什么样的人适合参保即将推出的保险产品,保险公司需要了解潜在参保用户中具有指定的某个或某些属性的用户情况。这说明在用户中发现指定特征用户同样具有重要的应用价值。但是特征属性属于个人敏感信息,用户不希望公开自己的特征属性信息,同时随着移动网络、传感器网络、物联网等技术的发展,接入互联网的用户是海量级的。因此,研究如何在海量用户环境下具有隐私保护的特征用户发现与统计是一个重要课题。
技术实现思路
为了解决上述的技术问题,本专利技术提供了一种海量用户系统中具有隐私保护的特征用户发现与统计方法。本专利技术所采用的技术方案是:一种海量用户系统中具有隐私保护的特征用户发现与统计方法,所述系统包括m个区域网关、1个全局网关GGW和1个策略中心SC;每个区域包括n个用户和1个区域网关;针对M种特征属性{w1,w2,…,wM},策略中心SC统计出mn个用户中2M种特征用户的用户数,获得mn个用户中目标特征用户的用户数;所述特征用户是指具有某种或某些属性的用户,所述目标特征用户是指具有指定的目标属性的用户;将第i个区域的第j个用户表示为Uij,i=1,2,…,m,j=1,2,…,n;将第i个区域对应的区域网关表示为RGWi,i=1,2,…,m;将用户Uij的私有属性集记为Wij,i=1,2,…,m,j=1,2,…,n;用户Uij的特征属性集Wij被表示为一个M维的属性向量如果用户Uij具有属性wk,则xijk=1,否则xijk=0,i=1,2,…,m,j=1,2,…,n,k=1,2,…,M;其特征在于,所述方法包括以下步骤:步骤1:系统初始化;步骤2:用户特征值向量生成及其密文生成;步骤3:具有隐私保护的单区域用户密文计算;步骤4:具有隐私保护的海量用户密文计算;步骤5:海量特征用户统计结果获取以及快速查询目标特征用户的统计结果。本专利技术方法与现有的技术相比有如下的优点和有益效果:(1)本专利技术解决了如何在海量用户中发现特征用户以及如何获得各种特征用户在海量用户中的分布情况的问题,具有非常好的实际应用价值。该方法可以应用到电子商务、电子医疗、电子政务、舆情管理、保险等领域中,具有非常广泛的应用范围。(2)解决特征用户的发现和统计问题,需要解决的首要问题是如何表示特征用户。本专利技术所指的特征用户是指具有某种或某些属性的用户。本专利技术用一个整型的属性特征值表示一类特征用户。针对M种特征属性,最多有2M种特征用户,对应2M个特征值,用一个2M维的特征值向量表示一个用户属于哪几类的特征用户。如果用户具有特征值k1、k2(这说明该用户既是第k1类特征用户又是第k2类特征用户),那么该用户的特征值向量的第k1个分量和第k2个分量为1,其余分量为0。用户的特征值向量如何获得呢?显然,求解该问题需要求出用户具有的所有特征值。本专利技术首先将用户的特征属性集表示为一个M维的属性向量,如果用户具有第k种属性,则该用户属性向量的第k个分量为1,否则为0。根据用户的属性向量,生成所有至少包含一个1的01串,将每个01串视为二进制数求其对应的十进制数,求得的十进制数即为该用户的特征值。(3)解决海量用户环境下的具有隐私保护的特征用户的发现和统计问题,本专利技术采用分层的思想和同态加密算法,将海量用户的特征值向量分层隐藏在具有同态性的密文中,特征用户的发现和统计通过密文级上的运算完成,对运算得到的密文进行解密,以“剥洋葱”的方式对解密得到结果一层一层地进行解析,最终得到各种特征用户在海量用户中的分布情况。附图说明图1:本专利技术实施例的框架图;图2:本专利技术实施例的方法流程图。具体实施方式为了便于本领域普通技术人员理解和实施本专利技术,下面结合附图及实施例对本专利技术作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本专利技术,并不用于限定本专利技术。本专利技术提供的一种海量用户系统中具有隐私保护的特征用户发现与统计方法,请见图1,系统包括m个区域网关、1个全局网关GGW和1个策略中心SC;每个区域包括n个用户和1个区域网关;针对M种特征属性{w1,w2,…,wM},策略中心SC统计出mn个用户中2M种特征用户的用户数,获得mn个用户中目标特征用户的用户数;所述特征用户是指具有某种或某些属性的用户,所述目标特征用户是指具有指定的目标属性的用户;例如,假设有5种特征属性{女性,25岁以下,患子宫肌瘤,已婚,未婚},患子宫肌瘤的女性是本专利技术所指的特征用户、已婚女性是专利技术所指的特征用户、25岁以下未婚用户是本专利技术所指的特征用户、已婚用户是本专利技术所指的特征用户等等,基于5种特征属性{女性,25岁以下,患子宫肌瘤,已婚,未婚}的特征用户有25=32种。同时,策略中心SC可以快速获得mn个用户中目标特征用户的用户数。目标特征用户是指具有指定的目标属性的用户。例如,为了更好的制定保险策略,保险公司需要统计出年龄在25岁以下患子宫肌瘤的女性人数。在这个应用场景中,25岁以下患子宫肌瘤的女性即为本专利技术所指的目标特征用户。将第i个区域的第j个用户表示为Uij,i=1,2,…,m,j=1,2,…,n;将第i个区域对应的区域网关表示为RGWi,i=1,2,…,m;将用户Uij的私有属性集记为Wij,i=1,2,…,m,j=1,2,…,n;用户Uij的特征属性集Wij被表示为一个M维的属性向量如果用户Uij具有属性wk,则xijk=1,否则xijk=0,i=1,2,…,m,j=1,2,…,n,k=1,2,…,M;请见图2,本实施例的方法包括以下步骤:步骤1:系统初始化;请见图2中的步骤1,系统初始化的具体包括以下子步骤:步骤1.1:策略中心SC从自然数集中选择安全参数κ,计算Paillier加密算法的公钥(N=pq,g)和私钥(λ,μ),其中p、q是两个阶为κ的大素数,g是的一个生成元,gcd(a,N2)=1}。策略中心SC随机选择一个小于N的整数R1和R2作为加密参数,确保R1>n2M,其中n为一个区域中的用户数,m为区域的个数,M为特征属性的个数。步骤1.2:区域网关RGWi(i=1,2,…,m)生成自己的公私钥对。步骤1.3:全局网关GGW生成自己的公私钥对。步骤1.4:用户Uij(i=1,2,…,m,j=1,2,…,n)生成自己的公私钥对,向策略中心SC发生注册请求,策略中心SC向其返回加密参数R1和R2。步骤2:用户特征值向量生成及其密文生成;步骤2.1:用户Uij本文档来自技高网...

【技术保护点】
1.一种海量用户系统中具有隐私保护的特征用户发现与统计方法,所述系统包括m个区域网关、1个全局网关GGW和1个策略中心SC;每个区域包括n个用户和1个区域网关;针对M种特征属性{w1,w2,…,wM},策略中心SC统计出mn个用户中2M种特征用户的用户数,获得mn个用户中目标特征用户的用户数;所述特征用户是指具有某种或某些属性的用户,所述目标特征用户是指具有指定的目标属性的用户;将第i个区域的第j个用户表示为Uij,i=1,2,…,m,j=1,2,…,n;将第i个区域对应的区域网关表示为RGWi,i=1,2,…,m;将用户Uij的私有属性集记为Wij,i=1,2,…,m,j=1,2,…,n;用户Uij的特征属性集Wij被表示为一个M维的属性向量

【技术特征摘要】
1.一种海量用户系统中具有隐私保护的特征用户发现与统计方法,所述系统包括m个区域网关、1个全局网关GGW和1个策略中心SC;每个区域包括n个用户和1个区域网关;针对M种特征属性{w1,w2,…,wM},策略中心SC统计出mn个用户中2M种特征用户的用户数,获得mn个用户中目标特征用户的用户数;所述特征用户是指具有某种或某些属性的用户,所述目标特征用户是指具有指定的目标属性的用户;将第i个区域的第j个用户表示为Uij,i=1,2,…,m,j=1,2,…,n;将第i个区域对应的区域网关表示为RGWi,i=1,2,…,m;将用户Uij的私有属性集记为Wij,i=1,2,…,m,j=1,2,…,n;用户Uij的特征属性集Wij被表示为一个M维的属性向量如果用户Uij具有属性wk,则xijk=1,否则xijk=0,i=1,2,…,m,j=1,2,…,n,k=1,2,…,M;其特征在于,所述方法包括以下步骤:步骤1:系统初始化;步骤2:用户特征值向量生成及其密文生成;步骤3:具有隐私保护的单区域用户密文计算;步骤4:具有隐私保护的海量用户密文计算;步骤5:海量特征用户统计结果获取以及快速查询目标特征用户的统计结果。2.根据权利要求1所述的海量用户系统中具有隐私保护的特征用户发现与统计方法,其特征在于,步骤1的具体实现包括以下子步骤:步骤1.1:策略中心SC生成系统相关参数及其公私钥对;策略中心SC随机选择整数R1和R2作为加密参数,确保R1>n2M,其中n为一个区域中的用户数,m为区域的个数,M为特征属性的个数;步骤1.2:区域网关RGWi生成自己的公私钥对,i=1,2,…,m;步骤1.3:全局网关GGW生成自己的公私钥对;步骤1.4:用户Uij生成自己的公私钥对,向策略中心SC发生注册请求,策略中心SC向其返回加密参数R1和R2;其中i=1,2,…,m,j=1,2,…,n。3.根据权利要求2所述的海量用户系统中具有隐私保护的特征用户发现与统计方法,其特征在于,步骤2的具体实现包括以下子步骤:步骤2.1:用户Uij根据自己的属性向量生成对应的特征值向量用户Uij根据自己的属性向量生成各分量构成的至少包括一个1的所有01串,将这些01串视为二...

【专利技术属性】
技术研发人员:沈华张明武刘白陈效孙代杰
申请(专利权)人:湖北工业大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1