【技术实现步骤摘要】
一种用户隐私数据分析方法及装置
本专利技术属于用户隐私数据保护
,具体涉及一种用户隐私数据分析方法及装置。
技术介绍
目前,与用户的身份敏感信息、行为信息等方面相关的大数据的采集和分析功能日益普及,在产品和服务定制,精准推荐、用户等级评估等方面起到了重要的作用。但是,也带来了用户隐私保护方面的新问题,可能造成记录了用户隐私的数据未经授权而被传播,甚至发生泄露。存在问题或缺陷:现有技术中对用户隐私的保护手段主要是在存储和传输时进行加密,以及对涉隐私数据的访问进行比较严格的权限控制。这些手段对于防御非法截留、窃取数据比较有效,但是对于具有权限的数据获取者、分析者不适当地拷贝、使用、传输用户隐私相关数据的情况不能起到作用。
技术实现思路
针对上述数据隐私保护技术手段有限,部分情况不起作用等问题,本专利技术提供了一种用户隐私数据分析方法及装置。本申请公开的一种用户隐私数据分析方法,包括下列步骤:S100、数据采集:获得涉及用户隐私的初始数据;所述初始数据的采集方式包括文本格式采集、X ...
【技术保护点】
1.一种用户隐私数据分析方法,其特征在于:包括下列步骤:/nS100、数据采集:获得涉及用户隐私的初始数据;所述初始数据的采集方式包括文本格式采集、XML表单或者其它描述性格式采集;/nS200、构建规则树:根据知识挖掘预先构建规则树,所述规则树包括按逻辑关系关联的字段名和关键词;/nS300、元数据集合构建:将所述初始数据与规则树进行匹配,从所述初始数据中自动提取字段名和字段属性值的元数据,并依据规则树的逻辑关系生成元数据集合;/nS400、元数据集合映射:元数据集合映射至分布式特征集合进行匹配,获得分布式特征组;所述分布式特征集合用于从元数据集合里面中提取分布式特征;所 ...
【技术特征摘要】
1.一种用户隐私数据分析方法,其特征在于:包括下列步骤:
S100、数据采集:获得涉及用户隐私的初始数据;所述初始数据的采集方式包括文本格式采集、XML表单或者其它描述性格式采集;
S200、构建规则树:根据知识挖掘预先构建规则树,所述规则树包括按逻辑关系关联的字段名和关键词;
S300、元数据集合构建:将所述初始数据与规则树进行匹配,从所述初始数据中自动提取字段名和字段属性值的元数据,并依据规则树的逻辑关系生成元数据集合;
S400、元数据集合映射:元数据集合映射至分布式特征集合进行匹配,获得分布式特征组;所述分布式特征集合用于从元数据集合里面中提取分布式特征;所述分布式特征集合当中包含多种类型的分布式特征,每一种类型的分布式特征当中均具有该类型相应的权重参数值;
S500、数据输出:将元数据集合的分布式特征组进行网络传输,提供给数据分析者进行存储和分析。
2.根据权利要求1所述的一种用户隐私数据分析方法,其特征在于:所述S300元数据集合构建中,对于文本格式采集的初始数据,将其文本内容与规则树的字段名、描述关键词进行检索比对,然后从初始数据中自动提取字段名和字段属性值的元数据,并且元数据参照规则树的逻辑关系进行组织,形成元数据集合;
对于XML表单或者其它描述性格式采集的初始数据,采用字段匹配的方式,把XML或者其它描述标签与规则树的字段名、描述关键词进行匹配,从初始数据中自动提取字段名和字段属性值的元数据,并且元数据参照规则树的逻辑关系进行组织,形成元数据集合。
3.根据权利要求1所述的一种用户隐私数据分析方法,其特征在于:所述S400数据映射,具体包括如下步骤:
S410、将分布式特征集合与元数据集合参照其结构关联进行匹配,获得分布式特征集合与元数据集合的匹配度;元数据集合中字段名的字段属性值落入第k个分布式特征的同字段名取值区间的次数Mk作为该分布式特征与元数据集合的匹配度。
4.根据权利要求3所述的一种用户隐私数据分析方法,其特征在于:所述S400数据映射,还包括如下步骤:
S420、根据分布式特征集合的权重参数值以及分布式特征集合与元数据集合的匹配度,确定分布式特征组的特征值;根据分布式特征集合中的每个分布式特征的权重参数值Vk以及分布式特征与元数据集合的匹配度Mk,确定元数据集合的分布式特征值组中的特征值,元数据集合对应于第k个分布式特征的特征值
其中l2,l3为经验常数;
则元数据集合对应于分布式特征集合的各个分布式特征的特征值,组合在一起形成:<T1,T2,…TK…>即作为该元数据集合的分布式特征组。
5.根据权利要求4所述的一种用户隐私数据分析方法,其特征在于:所述步骤S420中,对于分布式特征具有N个字段名,则该分布式特征的权重参数值为:
其中k表示分布式特征集合中的第k个类型的分布式特征,VK为第k个分布式特征的权重参数值;i为字段名的序号,共N个字段名;l1为常数系数,以经验值确定其取值,Si为第i个字段名的取值区间范围的...
【专利技术属性】
技术研发人员:周勇,仰守浩,
申请(专利权)人:上海竞动科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。