The invention discloses a digital library user behavior preference privacy protection evaluation method and system. The method includes the following steps: (1) obtaining a pseudo Book behavior sequence set for the user Book behavior sequence output by the preference privacy protection method; (2) calculating its similarity to the user Book behavior sequence characteristics; (3) calculating its preference security with the user Book behavior sequence; (4) when the feature similarity is more than the presupposed feature phase When the similarity threshold and the preference security exceed the preference security threshold, the evaluation of the preferred privacy protection method can effectively ensure the preference privacy security of the user Book behavior sequence. The system comprises a data acquisition module, a feature similarity acquisition module, a preference safety acquisition module, and a judgment module. The invention provides a unified evaluation method and system, and provides quantitative indicators, with high feasibility and uniform standards.
【技术实现步骤摘要】
数字图书馆用户图书行为偏好隐私保护评价方法及系统
本专利技术属于隐私保护领域,更具体地,涉及一种数字图书馆用户图书行为的偏好隐私保护方法及系统。
技术介绍
随着云计算等新兴网络信息技术的迅速发展,数字图书馆的范畴得到不断的延伸,已成为人们日常生活的重要组成部分。然而,在给用户带来巨大便利同时,数字图书馆的服务器端也正变得越来越“不可信”,从而引发了数字图书馆用户对个人隐私安全的极度担忧。用户隐私安全问题已成为制约数字图书馆发展与应用的重要障碍之一。数字图书馆的用户个人隐私主要表现为两个方面:①用户个人资料隐私,包括身份标识隐私(如身份证号)和背景资料隐私(如职业、收入等);②用户图书行为偏好隐私,即使用图书服务时(如图书浏览服务、图书检索服务、图书推荐服务等),用户图书行为(用户服务请求)背后所蕴含的用户兴趣偏好隐私(如图书浏览图书行为蕴含着用户偏好的图书偏好类别)。这些敏感信息被不可信数字图书馆服务器大量地收集,已成为用户个人隐私泄露的主要根源。其中,用户资料隐私安全问题可通过数据加密技术较好地解决,即将用户个人资料加密后再存放到数字图书馆服务器中,这样即使它们不幸泄露,也难以被读懂。然而,加密方法并不适用于用户图书行为偏好隐私,因为图书馆服务需要服务器的支持,如果加密用户图书行为会使得服务器因无法“读懂”服务请求,而使得图书馆服务变得不可用。为此,如何有效地保护数字图书馆用户的图书行为偏好隐私安全,已成为一个至关重要的问题。早期,图书馆领域学者更多地从法律角度研究数字图书馆的用户隐私保护问题。虽然制定用户隐私权相关的法律能在一定程度上保护用户隐私,但是 ...
【技术保护点】
一种数字图书馆用户图书行为偏好隐私保护评价方法,其特征在于,包括以下步骤:(1)对于待评价的数字图书馆用户图书行为的偏好隐私保护方法,输入给定由不同行为类别用户图书行为组成的用户图书行为序列,并获取所述偏好隐私保护方法针对所述用户图书行为序列输出的伪图书行为序列集;(2)对于步骤(1)获取的伪图书行为序列集以及用户图书行为序列,计算所述伪图书行为序列集与用户图书行为序列特征相似性;(3)对于步骤(1)获取的伪图书行为序列集以及用户图书行为序列,计算其与用户图书行为序列偏好安全性;(4)判断步骤(2)中获得的特征相似性是否超过预设的特征相似性阈值;判断步骤(3)中获得的偏好安全性是否超过预设的偏好安全性阈值;当所述特征相似性超过预设的特征相似性阈值且所述偏好安全性超过偏好安全性阈值时,评价所述偏好隐私保护方法能有效确保用户图书行为序列的偏好隐私安全性。
【技术特征摘要】
1.一种数字图书馆用户图书行为偏好隐私保护评价方法,其特征在于,包括以下步骤:(1)对于待评价的数字图书馆用户图书行为的偏好隐私保护方法,输入给定由不同行为类别用户图书行为组成的用户图书行为序列,并获取所述偏好隐私保护方法针对所述用户图书行为序列输出的伪图书行为序列集;(2)对于步骤(1)获取的伪图书行为序列集以及用户图书行为序列,计算所述伪图书行为序列集与用户图书行为序列特征相似性;(3)对于步骤(1)获取的伪图书行为序列集以及用户图书行为序列,计算其与用户图书行为序列偏好安全性;(4)判断步骤(2)中获得的特征相似性是否超过预设的特征相似性阈值;判断步骤(3)中获得的偏好安全性是否超过预设的偏好安全性阈值;当所述特征相似性超过预设的特征相似性阈值且所述偏好安全性超过偏好安全性阈值时,评价所述偏好隐私保护方法能有效确保用户图书行为序列的偏好隐私安全性。2.如权利要求1所述的数字图书馆用户图书行为偏好隐私保护评价方法,其特征在于,步骤(2)所述序列特征相似性即所述为图书行为序列与用于图书行为序列之间分布特点、连续性和/或关联性的相似程度,所述伪图书行为序列集与用户图书行为序列相似性特征记作:其中为伪图书行为序列集中的一个伪图书行为序列,为用户图书行为序列,为所述用户图书行为序列与所述伪图书行为序列特征相似值。所述用户图书行为序列与所述伪图书行为序列特征相似值按照如下方法计算:所述用户图书行为序列由n个不同行为类别的图书行为子序列构成,即所述伪图书行为序列也由n个不同行为类别的图书行为子序列构成,即其中对应1≤j≤n;则关于的特征相似值为两者的分布特征相似值、连续特征相似值和关联特征相似值的总和。3.如权利要求2所述的数字图书馆用户图书行为偏好隐私保护评价方法,其特征在于,所述关于的特征相似值计算公式如下:其中,为第j类用户图书行为子序列和第j类伪图书行为子序列的分布特征相似值,为第j类用户图书行为子序列和第j类伪图书行为子序列的连续特征相似值,为第j类用户图书行为子序列和第j类伪图书行为子序列的关联特征相似值;为关联的用户图书行为序列,即中除外的用户图书行为序列,为关联的伪图书行为序列,即中除外的伪图书行为序列。用户图书行为子序列伪图书行为子序列1≤l≤i。4.如权利要求3所述的数字图书馆用户图书行为偏好隐私保护评价方法,其特征在于,所述第j类用户图书行为子序列和第j类伪图书行为子序列的分布特征相似值按照如下方式计算:其中,为伪图书行为的分布特征向量,为用户图书行为的分布特征向量;对于任意图书行为其分布特征向量为:其中,为图书行为的第q项可区分特征的特征值,记作Fp(a):表示正实数,表示所有可能行为组成的空间,其仅与图书行为本身相关。5.如权利要求3所述的数字图书馆用户图书行为偏好隐私保护评价方法,其特征在于,所述第j类用户图书行为子序列和第j类伪图书行为子序列的连续特征相似值为伪图书行为子序列连续特征向量和用户图书行为子序列连续特征向量的余弦值,r为可区分连续特征的项数,即可区分不同图书行为序列的连续特征项数,按照如下方法计算:其中,为伪图书行为子序列第s项连续特征的值,为用户图书行为子序列第s项连续特征的值,计算方法如下:其中,为前l个图书行为构成的子序列,为前l个图书行为构成的子序列,为伪图书行为关于图书行为序列连续特征函数值,及连续特征函数的返回值,为用户图书行为关于图书行为序列连续特征函数值,及连续特征函数的返回值。其中,表示正实数,表示所有可能行为组成的空间。6.如权利要求3所述的数字图书馆用户图书行为偏好隐私保护评价方法,其特征在于,所述关联特征相似值为伪图书行为序列关于用户图书行为序列的关联特征向量之间的余弦相似性,即:其中为伪图书行为序列的关联伪图书行为序列,为用户图书行为序列的关联用户图书行为序列,为伪图书行为关于行为序列的关联特征,为伪图书行为关于行为序列的关联特征,按照如下方法计算:任意图书行为和其它行为类别任意行...
【专利技术属性】
技术研发人员:吴宗大,李仁超,谢坚,
申请(专利权)人:温州大学瓯江学院,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。