数字图书馆用户图书行为偏好隐私保护评价方法及系统技术方案

技术编号:17837947 阅读:55 留言:0更新日期:2018-05-03 19:30
本发明专利技术公开了一种数字图书馆用户图书行为偏好隐私保护评价方法及系统。所述方法包括以下步骤:(1)获取偏好隐私保护方法针对用户图书行为序列输出的伪图书行为序列集;(2)计算其与用户图书行为序列特征相似性;(3)计算其与用户图书行为序列偏好安全性;(4)当所述特征相似性超过预设的特征相似性阈值且所述偏好安全性超过偏好安全性阈值时,评价所述偏好隐私保护方法能有效确保用户图书行为序列的偏好隐私安全性。所述系统包括数据获取模块、特征相似性获取模块、偏好安全性获取模块、以及判断模块。本发明专利技术提供了统一的评价方法和系统,提供了量化指标,可行性高,标准统一。

Privacy preserving evaluation method and system for user behavior preference in Digital Library

The invention discloses a digital library user behavior preference privacy protection evaluation method and system. The method includes the following steps: (1) obtaining a pseudo Book behavior sequence set for the user Book behavior sequence output by the preference privacy protection method; (2) calculating its similarity to the user Book behavior sequence characteristics; (3) calculating its preference security with the user Book behavior sequence; (4) when the feature similarity is more than the presupposed feature phase When the similarity threshold and the preference security exceed the preference security threshold, the evaluation of the preferred privacy protection method can effectively ensure the preference privacy security of the user Book behavior sequence. The system comprises a data acquisition module, a feature similarity acquisition module, a preference safety acquisition module, and a judgment module. The invention provides a unified evaluation method and system, and provides quantitative indicators, with high feasibility and uniform standards.

【技术实现步骤摘要】
数字图书馆用户图书行为偏好隐私保护评价方法及系统
本专利技术属于隐私保护领域,更具体地,涉及一种数字图书馆用户图书行为的偏好隐私保护方法及系统。
技术介绍
随着云计算等新兴网络信息技术的迅速发展,数字图书馆的范畴得到不断的延伸,已成为人们日常生活的重要组成部分。然而,在给用户带来巨大便利同时,数字图书馆的服务器端也正变得越来越“不可信”,从而引发了数字图书馆用户对个人隐私安全的极度担忧。用户隐私安全问题已成为制约数字图书馆发展与应用的重要障碍之一。数字图书馆的用户个人隐私主要表现为两个方面:①用户个人资料隐私,包括身份标识隐私(如身份证号)和背景资料隐私(如职业、收入等);②用户图书行为偏好隐私,即使用图书服务时(如图书浏览服务、图书检索服务、图书推荐服务等),用户图书行为(用户服务请求)背后所蕴含的用户兴趣偏好隐私(如图书浏览图书行为蕴含着用户偏好的图书偏好类别)。这些敏感信息被不可信数字图书馆服务器大量地收集,已成为用户个人隐私泄露的主要根源。其中,用户资料隐私安全问题可通过数据加密技术较好地解决,即将用户个人资料加密后再存放到数字图书馆服务器中,这样即使它们不幸泄露,也难以被读懂。然而,加密方法并不适用于用户图书行为偏好隐私,因为图书馆服务需要服务器的支持,如果加密用户图书行为会使得服务器因无法“读懂”服务请求,而使得图书馆服务变得不可用。为此,如何有效地保护数字图书馆用户的图书行为偏好隐私安全,已成为一个至关重要的问题。早期,图书馆领域学者更多地从法律角度研究数字图书馆的用户隐私保护问题。虽然制定用户隐私权相关的法律能在一定程度上保护用户隐私,但是并不能根本上解决用户隐私安全问题,数字图书馆的用户隐私安全问题更多地需要采用隐私保护技术加以解决。近年来,学者尝试从技术角度研究该问题,但已有的技术方法还不够深入且缺乏系统,并且它们更多是针对用户资料隐私,没有关注用户图书行为隐私问题。此外,针对不可信网络环境下的用户隐私安全问题,信息科学领域学者已给出了许多有效方法,代表性地有:隐私加密技术、掩盖变换技术和匿名化技术。以下简要介绍这些方法的技术特点,(1)隐私加密是指通过加密变换,使得用户图书行为对服务器端不可见,以达到隐私保护的目的,代表性地有隐私信息检索技术。但该类技术方法没有考虑用户隐私安全度量问题,不能实现对用户隐私的完全保护。更重要地是,该类技术不仅要求额外硬件和复杂算法的支持,且要求改变服务器端的服务算法,从而引起整个平台架构的改变,降低了方法在数字图书馆中的可用性。(2)敏感数据掩盖技术是指通过伪造数据或者使用一般化数据来掩盖涉及用户敏感偏好的图书行为数据。例如,文献设计了一个针对个性网页搜索的用户偏好保护方法,它通过建立用户偏好分层树,并使用概括性偏好代替针对性偏好,以保护用户敏感偏好。针对其它应用场景,研究者还提出了一些其它的用户隐私变换掩盖技术。由于改写了用户图书行为数据,该类方法对服务的准确性会造成一定负面影响,即其隐私保护需以牺牲服务质量为代价,难以满足数字图书馆的应用需求。(3)匿名化技术是用户隐私保护中广泛使用的一种技术,它通过隐藏或伪装用户身份标识,允许用户以不暴露身份的方式使用系统。然而,匿名化隐私保护技术也受到了许多质疑。文献分析了匿名化对隐私保护的不足,并给出实验证明。结果表明,通过匿名化技术收集的用户数据往往难以保证质量,因为在没有确认身份的情况下,用户可能会提交许多无用的数据。更重要地是,数字图书馆一般要求用户必须实名登录后才能使用各项图书馆服务,所以,匿名化隐私保护技术难以有效地应用于数字图书馆。越来越多的数字图书馆用于隐私图书行为保护方法被开发出来,然而这些方法隐私保护效果如何,是否能保证用于隐私,并没有方法来评价
技术实现思路
针对现有技术的以上缺陷或改进需求,本专利技术提供了一种数字图书馆用户图书行为的偏好隐私保护方法及系统,其目的在于数字图书馆用户图书行为的偏好隐私保护评价方法及系统,由此解决现有技术没有统一的方法科学客观的评价数字图书馆用户隐私保护方法的隐私保护效果的技术问题。为实现上述目的,按照本专利技术的一个方面,提供了一种数字图书馆用户图书行为偏好隐私保护评价方法,包括以下步骤:(1)对于待评价的数字图书馆用户图书行为的偏好隐私保护方法,输入给定由不同行为类别用户图书行为组成的用户图书行为序列,并获取所述偏好隐私保护方法针对所述用户图书行为序列输出的伪图书行为序列集;(2)对于步骤(1)获取的伪图书行为序列集以及用户图书行为序列,计算其与用户图书行为序列特征相似性,所述序列特征相似性即所述为图书行为序列与用于图书行为序列之间分布特点、连续性和/或关联性的相似程度;(3)对于步骤(1)获取的伪图书行为序列集,计算其与用户图书行为序列偏好安全性,所述偏好安全性即针对用于预设的敏感图书偏好集合的用于图书行为暴露程度降低;(4)判断步骤(2)中获得的特征相似性是否超过预设的特征相似性阈值;判断步骤(3)中获得的偏好安全性是否超过预设的偏好安全性阈值;当所述特征相似性超过预设的特征相似性阈值且所述偏好安全性超过偏好安全性阈值时,评价所述偏好隐私保护方法能有效确保用户图书行为序列的偏好隐私安全性。优选地,所述数字图书馆用户图书行为偏好隐私保护评价方法,其步骤(2)所述伪图书行为序列集与用户图书行为序列相似性特征记作:其中为伪图书行为序列集中的一个伪图书行为序列,为用户图书行为序列,为所述用户图书行为序列与所述伪图书行为序列特征相似值。所述用户图书行为序列与所述伪图书行为序列特征相似值按照如下方法计算:所述用户图书行为序列由n个不同行为类别的图书行为子序列构成,即所述伪图书行为序列也由n个不同行为类别的图书行为子序列构成,即其中对应1≤j≤n;则关于的特征相似值为两者的分布特征相似值、连续特征相似值和关联特征相似值的总和。优选地,所述数字图书馆用户图书行为偏好隐私保护评价方法,其关于的特征相似值计算公式如下:其中,为第j类用户图书行为子序列和第j类伪图书行为子序列的分布特征相似值,为第j类用户图书行为子序列和第j类伪图书行为子序列的连续特征相似值,为第j类用户图书行为子序列和第j类伪图书行为子序列的关联特征相似值;为关联的用户图书行为序列,即中除外的用户图书行为序列,为关联的伪图书行为序列,即中除外的伪图书行为序列。用户图书行为子序列伪图书行为子序列优选地,所述数字图书馆用户图书行为偏好隐私保护评价方法,其第j类用户图书行为子序列和第j类伪图书行为子序列的分布特征相似值按照如下方式计算:其中,为伪图书行为的分布特征向量,为用户图书行为的分布特征向量;对于任意图书行为其分布特征向量为:其中,为图书行为的第q项可区分特征的特征值,记作表示正实数,表示所有可能行为组成的空间,其仅与图书行为本身相关。优选地,所述数字图书馆用户图书行为偏好隐私保护评价方法,其第j类用户图书行为子序列和第j类伪图书行为子序列的连续特征相似值为伪图书行为子序列连续特征向量和用户图书行为子序列连续特征向量的余弦值,r为可区分连续特征的项数,即可区分不同图书行为序列的连续特征项数,按照如下方法计算:其中,为伪图书行为子序列第s项连续特征的值,为用户图书行为子序列第s项连续特征的值,计算方法如本文档来自技高网
...
数字图书馆用户图书行为偏好隐私保护评价方法及系统

【技术保护点】
一种数字图书馆用户图书行为偏好隐私保护评价方法,其特征在于,包括以下步骤:(1)对于待评价的数字图书馆用户图书行为的偏好隐私保护方法,输入给定由不同行为类别用户图书行为组成的用户图书行为序列,并获取所述偏好隐私保护方法针对所述用户图书行为序列输出的伪图书行为序列集;(2)对于步骤(1)获取的伪图书行为序列集以及用户图书行为序列,计算所述伪图书行为序列集与用户图书行为序列特征相似性;(3)对于步骤(1)获取的伪图书行为序列集以及用户图书行为序列,计算其与用户图书行为序列偏好安全性;(4)判断步骤(2)中获得的特征相似性是否超过预设的特征相似性阈值;判断步骤(3)中获得的偏好安全性是否超过预设的偏好安全性阈值;当所述特征相似性超过预设的特征相似性阈值且所述偏好安全性超过偏好安全性阈值时,评价所述偏好隐私保护方法能有效确保用户图书行为序列的偏好隐私安全性。

【技术特征摘要】
1.一种数字图书馆用户图书行为偏好隐私保护评价方法,其特征在于,包括以下步骤:(1)对于待评价的数字图书馆用户图书行为的偏好隐私保护方法,输入给定由不同行为类别用户图书行为组成的用户图书行为序列,并获取所述偏好隐私保护方法针对所述用户图书行为序列输出的伪图书行为序列集;(2)对于步骤(1)获取的伪图书行为序列集以及用户图书行为序列,计算所述伪图书行为序列集与用户图书行为序列特征相似性;(3)对于步骤(1)获取的伪图书行为序列集以及用户图书行为序列,计算其与用户图书行为序列偏好安全性;(4)判断步骤(2)中获得的特征相似性是否超过预设的特征相似性阈值;判断步骤(3)中获得的偏好安全性是否超过预设的偏好安全性阈值;当所述特征相似性超过预设的特征相似性阈值且所述偏好安全性超过偏好安全性阈值时,评价所述偏好隐私保护方法能有效确保用户图书行为序列的偏好隐私安全性。2.如权利要求1所述的数字图书馆用户图书行为偏好隐私保护评价方法,其特征在于,步骤(2)所述序列特征相似性即所述为图书行为序列与用于图书行为序列之间分布特点、连续性和/或关联性的相似程度,所述伪图书行为序列集与用户图书行为序列相似性特征记作:其中为伪图书行为序列集中的一个伪图书行为序列,为用户图书行为序列,为所述用户图书行为序列与所述伪图书行为序列特征相似值。所述用户图书行为序列与所述伪图书行为序列特征相似值按照如下方法计算:所述用户图书行为序列由n个不同行为类别的图书行为子序列构成,即所述伪图书行为序列也由n个不同行为类别的图书行为子序列构成,即其中对应1≤j≤n;则关于的特征相似值为两者的分布特征相似值、连续特征相似值和关联特征相似值的总和。3.如权利要求2所述的数字图书馆用户图书行为偏好隐私保护评价方法,其特征在于,所述关于的特征相似值计算公式如下:其中,为第j类用户图书行为子序列和第j类伪图书行为子序列的分布特征相似值,为第j类用户图书行为子序列和第j类伪图书行为子序列的连续特征相似值,为第j类用户图书行为子序列和第j类伪图书行为子序列的关联特征相似值;为关联的用户图书行为序列,即中除外的用户图书行为序列,为关联的伪图书行为序列,即中除外的伪图书行为序列。用户图书行为子序列伪图书行为子序列1≤l≤i。4.如权利要求3所述的数字图书馆用户图书行为偏好隐私保护评价方法,其特征在于,所述第j类用户图书行为子序列和第j类伪图书行为子序列的分布特征相似值按照如下方式计算:其中,为伪图书行为的分布特征向量,为用户图书行为的分布特征向量;对于任意图书行为其分布特征向量为:其中,为图书行为的第q项可区分特征的特征值,记作Fp(a):表示正实数,表示所有可能行为组成的空间,其仅与图书行为本身相关。5.如权利要求3所述的数字图书馆用户图书行为偏好隐私保护评价方法,其特征在于,所述第j类用户图书行为子序列和第j类伪图书行为子序列的连续特征相似值为伪图书行为子序列连续特征向量和用户图书行为子序列连续特征向量的余弦值,r为可区分连续特征的项数,即可区分不同图书行为序列的连续特征项数,按照如下方法计算:其中,为伪图书行为子序列第s项连续特征的值,为用户图书行为子序列第s项连续特征的值,计算方法如下:其中,为前l个图书行为构成的子序列,为前l个图书行为构成的子序列,为伪图书行为关于图书行为序列连续特征函数值,及连续特征函数的返回值,为用户图书行为关于图书行为序列连续特征函数值,及连续特征函数的返回值。其中,表示正实数,表示所有可能行为组成的空间。6.如权利要求3所述的数字图书馆用户图书行为偏好隐私保护评价方法,其特征在于,所述关联特征相似值为伪图书行为序列关于用户图书行为序列的关联特征向量之间的余弦相似性,即:其中为伪图书行为序列的关联伪图书行为序列,为用户图书行为序列的关联用户图书行为序列,为伪图书行为关于行为序列的关联特征,为伪图书行为关于行为序列的关联特征,按照如下方法计算:任意图书行为和其它行为类别任意行...

【专利技术属性】
技术研发人员:吴宗大李仁超谢坚
申请(专利权)人:温州大学瓯江学院
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1