基于隐私保护的用户行为数据处理方法及系统技术方案

技术编号:34806273 阅读:24 留言:0更新日期:2022-09-03 20:13
本申请提供一种基于隐私保护的用户行为数据处理方法及系统,涉及信息安全技术领域,该方法包括:将获取的用户行为数据转化为有序的效用序列,形成效用序列数据库;提取效用序列数据库中的高效用序列模式及其所在效用序列的位置和效用信息;针对每一个高效用序列模式,获取该高效用序列模式中每个项的效用之和,选取其中效用和最大的项作为受害者物品,并修改受害者物品在效用序列中的效用以更新高效用序列模式的效用值,直到高效用序列模式的效用值小于最小效用阈值,停止修改;共享经修改的效用序列数据库。通过该方式,可以在保证敏感信息被隐藏的情况下,尽可能大的保持原始数据库的效用。始数据库的效用。始数据库的效用。

【技术实现步骤摘要】
基于隐私保护的用户行为数据处理方法及系统


[0001]本申请属于信息安全
,尤其涉及一种基于隐私保护的用户行为数据处理方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]随着大数据时代和计算机技术的发展,人们在超市或者电子商务平台的购买行为信息能够被收集并用于知识发现的过程。然而,这些数据可能会包含一些敏感信息,造成信息的隐私泄露。当这些敏感知识被第三方恶意获取时,会造成企业和组织的利润损失,隐私泄露已经成为人们不可避免的问题。因此,如何保护敏感信息不被发现,从而更好的为企业服务,是目前需要解决的问题。
[0004]高效用序列模式挖掘是模式识别领域的重要研究热点,在商业决策、股票市场分析等多个场景得到应用。目前,许多有效的高效用序列模式挖掘方法被提出,以发现有价值的效用序列模式,但也会有信息泄露的风险,例如,用户购买行为数据中包含更高效用的组合模式,可以为领导者决策提供支持,当这些组合模式被其他竞争对手发现并利用时,会造成企业的利益损失,在这种情况下,数据失去了它的保密性。
[0005]高效用序列模式隐藏是隐私保护数据挖掘(PPDM)的一个分支,它的实现方法是通过修改原始数据库,在给定的最小效用阈值下隐藏数据库中发现的所有的高效用序列模式,使其他人无法使用相同或更高的最小效用阈值在经过清理的数据库中发现这些模式。在对效用序列数据库使用隐藏方法时,会产生一定的副作用,即效用损失。高效用序列模式隐藏的目的是降低共享数据的可分析性,保证数据在一定程度上的隐私,同时保证数据库的完整性,这样仍然可以使用相同的模式挖掘框架对修改后的数据库进行有效的挖掘。专利技术人发现,现有的高效用序列模式隐藏方法仍然面临着一些问题:(1)采用效用矩阵和效用链结构来存储原始数据库和高效用序列模式的相关信息,导致在识别要修改的项(受害者物品)及其在原始数据库中的位置上花费大量时间;(2)为了识别和修改效用序列数据库中的受害者物品,隐藏过程需要进行大量的搜索操作;(3)隐藏过程通常会导致原始数据库效用的极大损失。

技术实现思路

[0006]为克服现有技术的不足,本申请提供一种基于隐私保护的用户行为数据处理方法及系统,用于实现对用户行为数据的隐私保护。
[0007]本申请采用的技术方案如下:
[0008]第一方面,本专利技术实施例提供一种基于隐私保护的用户行为数据处理方法,包括:
[0009]将获取的用户行为数据转化为有序的效用序列,形成效用序列数据库;
[0010]提取所述效用序列数据库中的高效用序列模式及其所在效用序列的位置和效用
信息,所述高效用序列模式的效用值大于或等于最小效用阈值;
[0011]针对每一个高效用序列模式,获取该高效用序列模式中每个项的效用之和,选取其中效用和最大的项作为受害者物品,并修改所述受害者物品在效用序列中的效用以更新高效用序列模式的效用值,直到高效用序列模式的效用值小于最小效用阈值,停止修改;
[0012]共享经修改的效用序列数据库,用于实现对用户行为数据的隐私保护。
[0013]在一种可能的实施方式中,在提取效用序列数据库中的高效用序列模式及其所在效用序列的位置和效用信息之后,还包括:根据提取的高效用序列模式对效用序列数据库中的所有效用序列赋予一个序列权值;按照序列权值对目标效用序列的修改顺序进行排序,并优先选取含有最大序列权值的目标效用序列进行修改。
[0014]在一种可能的实施方式中,将各效用序列中包含高效用序列模式的个数确定为效用序列的序列权值。
[0015]在一种可能的实施方式中,获取受害者物品的外部效用,根据所述外部效用、高效用序列模式的效用值与最小效用阈值的差值和受害者物品的效用之和,确定受害者物品的下降率;根据所述下降率修改受害者物品在效用序列中的效用。
[0016]在一种可能的实施方式中,所述将获取的用户行为数据转化为有序的效用序列,形成效用序列数据库,包括:获取用户在预设时间段内的购物信息,所述购物信息包括:购物时间、物品和消费金额;将同一购物时间购买的所有物品和每个物品对应的消费金额作为效用序列的项集,将项集按照购物时间的顺序进行排列,形成有序的效用序列;多个用户的效用序列组成效用序列数据库。
[0017]在一种可能的实施方式中,利用预设的高效用序列模式挖掘算法,提取效用序列数据库中的高效用序列模式及其所在效用序列的位置和效用信息。
[0018]第二方面,本申请实施例提供一种基于隐私保护的用户行为数据处理系统,包括:
[0019]获取模块,用于将获取的用户行为数据转化为有序的效用序列,形成效用序列数据库;
[0020]提取模块,用于提取所述效用序列数据库中的高效用序列模式及其所在效用序列的位置和效用信息,所述高效用序列模式的效用值大于或等于最小效用阈值;
[0021]修改模块,用于针对每一个高效用序列模式,获取该高效用序列模式中每个项的效用之和,选取其中效用和最大的项作为受害者物品,并修改所述受害者物品在效用序列中的效用以更新高效用序列模式的效用值,直到高效用序列模式的效用值小于最小效用阈值,停止修改;
[0022]共享模块,用于共享经修改的效用序列数据库,用于实现对用户行为数据的隐私保护。
[0023]在一种可能的实施方式中,所述提取模块在用于提取效用序列数据库中的高效用序列模式及其所在效用序列的位置和效用信息之后,还包括:根据提取的高效用序列模式对效用序列数据库中的所有效用序列赋予一个序列权值;按照序列权值对目标效用序列的修改顺序进行排序,并优先选取含有最大序列权值的目标效用序列进行修改。
[0024]第三方面,本专利技术实施例提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述第一方面
和第一方面任一种可能的实施方式中所述的基于隐私保护的用户行为数据处理方法的步骤。
[0025]第四方面,本专利技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述第一方面和第一方面任一种可能的实施方式中所述的基于隐私保护的用户行为数据处理方法的步骤。
[0026]本申请的有益效果:
[0027](1)本申请通过提取效用序列数据库中的高效用序列模式及其所在效用序列的位置和效用信息,得到基于数组的效用数组结构用于隐藏过程,该结构可以在不重新扫描原始数据库的情况下快速、准确地定位到受害者物品,并在隐藏过程中,通过直接修改受害者物品的效用来降低高效用序列模式的效用,而不是改变受害者物品的数量,从而保证了原始数据库和清理后数据库的一致性,这样,在保证敏感信息被隐藏的情况下,尽可能大的保持原始数据库的效用。
[0028](2)提出序列权重的概念来定义原始本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于隐私保护的用户行为数据处理方法,其特征在于,包括:将获取的用户行为数据转化为有序的效用序列,形成效用序列数据库;提取所述效用序列数据库中的高效用序列模式及其所在效用序列的位置和效用信息,所述高效用序列模式的效用值大于或等于最小效用阈值;针对每一个高效用序列模式,获取该高效用序列模式中每个项的效用之和,选取其中效用和最大的项作为受害者物品,并修改所述受害者物品在效用序列中的效用以更新高效用序列模式的效用值,直到高效用序列模式的效用值小于最小效用阈值,停止修改;共享经修改的效用序列数据库,用于实现对用户行为数据的隐私保护。2.根据权利要求1所述的基于隐私保护的用户行为数据处理方法,其特征在于,在提取效用序列数据库中的高效用序列模式及其所在效用序列的位置和效用信息之后,还包括:根据提取的高效用序列模式对效用序列数据库中的所有效用序列赋予一个序列权值;按照序列权值对目标效用序列的修改顺序进行排序,并优先选取含有最大序列权值的目标效用序列进行修改。3.根据权利要求2所述的基于隐私保护的用户行为数据处理方法,其特征在于,将各效用序列中包含高效用序列模式的个数确定为效用序列的序列权值。4.根据权利要求1所述的基于隐私保护的用户行为数据处理方法,其特征在于,获取受害者物品的外部效用,根据所述外部效用、高效用序列模式的效用值与最小效用阈值的差值和受害者物品的效用之和,确定受害者物品的下降率;根据所述下降率修改受害者物品在效用序列中的效用。5.根据权利要求1所述的基于隐私保护的用户行为数据处理方法,其特征在于,所述将获取的用户行为数据转化为有序的效用序列,形成效用序列数据库,包括:获取用户在预设时间段内的购物信息,所述购物信息包括:购物时间、物品和消费金额;将同一购物时间购买的所有物品和每个物品对应的消费金额作为效用序列的项集,将项集按照购物时间的顺序进行排列,形成有序的效用序列;多个用户的效用序列...

【专利技术属性】
技术研发人员:徐田田石敏赵龙
申请(专利权)人:齐鲁工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1