当前位置: 首页 > 专利查询>浙江大学专利>正文

实现定制隐私保护的个性化信息检索系统的方法技术方案

技术编号:6137436 阅读:389 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种实现定制隐私保护的个性化信息检索系统的方法。通过分析基于用户模型的个性化信息检索系统的系统架构,利用多粒度语义泛化模型,在现有的个性化信息检索系统基础上提供完备的隐私保护解决方案。本发明专利技术定义了用户模型的表现形式、攻击者背景知识和攻击方式以及隐私保护目标,进而提出一个适用于支持隐私保护的个性化信息检索系统的通用框架。本发明专利技术在个性化信息检索系统中引入隐私保护的方法,充分利用不同用户对于隐私保护的特殊需求,保证隐私保护结果与用户隐私需求相匹配;而且通过开发查询质量指标和隐私风险指标,分析特定检索特性,权衡检索质量和隐私保护。

【技术实现步骤摘要】

本专利技术涉及个性化信息检索系统、敏感数据隐藏与隐私保护方法,特别是涉及一种。
技术介绍
信息检索技术和隐私保护技术是计算机领域中研究最为长远、应用最为广泛的两个技术。一直以来,这两项技术在发展过程中彼此基本相互独立。信息检索技术及以此为基础的个性化信息检索,用于各类海量数据的维护与查询,主要研究数据特征提取、索引维护、查询结果排序与评价方法。隐私保护技术主要应用于数据采集与发布领域,研究开放环境下对个体敏感数据的隐藏模型和代价评估方法。随着互联网技术的发展和Web资源的日渐丰富,特别是强调“以人为本”的Web2. 0 网络概念的兴起,越来越多的互联网信息检索应用通过分析用户行为、学习用户偏好以优化检索机制,提供个性化信息检索服务。然而,由于在此过程中,系统需要搜集和分析大量的用户个人信息,任何对此类信息的不当使用和发布都会导致严重的隐私泄露。该问题已经成为个性化信息检索系统被广泛应用的最大障碍。因此,业界迫切需要一个完善的信息检索解决方案,在提供高效、符合用户需要的检索结果的同时,保障用户的个人信息不被侵犯和滥用。但由于信息检索系统中隐私保护相关研究刚刚起步,目前尚未产生一个成熟完备的支持隐私保护的个性化信息检索方案。目前如Google、Yahoo等成熟的信息检索服务供应商对于其个性化产品的隐私保护,主要采用安全访问协议,保护数据不被攻击者截获。但这种方法只能保护数据传输信道的安全,不能防止服务器终端对用户隐私的侵犯。而在研究领域,目前成果主要采用在发送用户请求前,在客户端对于用户信息进行泛化处理,来限制服务提供商对于用户准确信息的掌握,同时保证服务质量。一方面这一方法没有充分利用不同用户对于隐私保护的特殊需求,隐私保护方法不能与用户隐私需求相匹配;另一方面该方法缺乏对不同检索请求特性的分析,难以在检索质量和隐私保护之间进行有效的权衡。由于信息检索系统与隐私保护系统在各自的领域都已经经历长久的发展,积累了众多成熟的技术。因此要实现支持隐私保护的个性化信息检索系统,应该在当前成熟的个性化信息检索解决方案中,最大限度地引入在数据采集与发布领域中丰富的隐私保护技术。此外,系统应根据用户的隐私需求和检索请求的特性,支持隐私保护方法的可定制,在检索质量和隐私保护之间进行有效的权衡。
技术实现思路
为了克服
技术介绍
中现有方法没有充分利用不同用户对于隐私保护的特殊需求, 隐私保护方法不能与用户隐私需求相匹配;而且缺乏对不同检索请求特性的分析,造成难以在检索质量和隐私保护之间进行有效的权衡问题。本专利技术的目的在于提供一种。本专利技术解决其技术问题采用的技术方案是,该方法的步骤如下步骤1)设计定制隐私保护的个性化信息检索系统的系统架构,并根据该系统架构选择相应的隐私保护模型;步骤2)实现步骤1)中隐私保护模型所需的多级语义粒度的用户模型,用于描述用户偏好,并在用户模型基础上定制用户隐私,分析攻击者模型和定义隐私保护目标;步骤3)开发支持隐私保护的个性化信息检索系统的通用框架,根据用户的隐私需求, 使用数据泛化技术对用户模型进行定制泛化;步骤4)基于用户模型开发分别用于预测量化当前用户模型用于个性化检索的查询质量指标和隐私风险指标,将该两个指标融合为综合性能指标;同时开发用于预测量化特定检索歧义程度的指标,以实现用户模型泛化的自适应调节;步骤5)开发用户模型泛化方法,针对特定信息检索请求的特性,依据步骤4)开发的三个指标,生成泛化用户模型,并使用该泛化用户模型进行个性化信息检索。所述步骤1)中设计的系统架构,用于分析该系统所使用的应用场景;在该应用场景中,用户不信任除自己之外的任何实体,因此隐私保护机制需要作为一个信息检索代理在客户端引入;该代理对用户模型在本地进行语义泛化后,才将其分享给服务器用于个性化信息检索;因此,该系统架构的设计方法如下a)每当用户提交一个信息检索请求,代理根据用户定制的隐私需求和该检索请求的内容特性,将完整的用户模型泛化成相应的实例;b)检索代理将用户提交的信息检索请求和相应的用户模型泛化实例,一并发送给服务器,用于个性化信息检索;c)服务器根据查询代理分享的用户模型泛化实例,对信息检索请求的结果进行个性化重排,并将结果发送回查询代理;d)查询代理对于取得的查询结果,使用本地完整的用户模型进一步优化,并将查询结果呈现给用户。所述步骤1)选取的隐私保护模型,需要与其系统架构相适应,由于系统架构要求对用户模型的隐私保护支持语义泛化,选取多粒度语义泛化模型;所述步骤2)用户模型选用应满足以下条件支持在多个语义粒度上描述用户偏好,以适应步骤1)中选取的选取多粒度语义泛化模型;且需要依据公用的语义分类法构建,使用户模型易于扩展;所述步骤2)中的定制用户隐私,包括a)隐私内容和b)隐私权重;所述系统在用户定制的隐私需求基础上,对用户模型进行最优泛化;所述步骤2)中的攻击者模型分析工作包含如下二个任务a)分析攻击者所掌握的先验背景知识和所使用的攻击方式;b)针对a)分析的先验背景知识和攻击方式,确立隐私保护的目标。所述步骤3)中开发的支持隐私保护的个性化信息检索系统的通用框架,包含如下步骤1)在系统初始化阶段a)分析用户原始数据,依据公用的语义分类法构建层级用户模型;b)用户自行在构建好的层级用户模型中,定制隐私需求,包括隐私语义内容和相应的隐私权重;2)在系统初始化完毕后,每当用户提交检索请求a)根据检索请求的内容,在层级用户模型中设置相关语义内容和相应的相关度权重;b)在框架步骤1)b)和2) a)基础上,通过预测性质指标,开发对用户模型进行近似最优泛化的方法;该方法输出用于个性化信息检索的最终用户模型。所述步骤4)中基于用户模型开发的查询质量指标和隐私风险指标分别用于完成如下任务a)根据层级用户模型中集成的面向特定检索请求的相关度信息来预测分享器对于个性化信息检索的效用;b)根据层级用户模型中集成的用户定制的隐私需求来预测分享其所导致的隐私风险;所述步骤4)中的综合性能指标,通过查询质量指标和隐私风险指标加权融合生成,并通过相应参数对两者权重进行调节;该综合指标作为步骤5)中的用户模型泛化方法优化的最终指标。所述步骤4)中基于用户模型开发的查询质量指标和隐私风险指标被开发为预测指标,即不需要采集用户对于信息检索结果排序的反馈信息,保证步骤5)中的用户模型泛化方法能够在客户端本地执行。所述步骤4)中开发的用于预测量化特定检索歧义程度的指标,负责在步骤5)的数据模型泛化方法执行前,预测特定检索是否需要通过个性化来提高检索质量;如果检索请求为非歧义请求,则直接执行非个性化检索,杜绝用户信息分享。所述步骤5)中开发的用户模型泛化方法为近似最优泛化方法;由于泛化方法搜索空间庞大,将其设计为基于代价的迭代方法,依据步骤4)中开发的综合性能指标,在每个迭代过程中,搜索能最大化综合性能指标的泛化结果,直至迭代终止。所述步骤5)中开发的用户模型泛化方法,根据两个不同的应用需要设计a)优化步骤4)中开发的综合性能指标;b)由用户指定隐私风险指标上界,系统负责在用户隐私风险上界下,最大化查询质量指标。本专利技术具有的有益效果是本专利技术在个性化信息检索系统中引入隐私保护的方法,充分利用不同用户对于隐私保护的特殊需求,保证隐私保护本文档来自技高网
...

【技术保护点】
1.一种实现定制隐私保护的个性化信息检索系统的方法,其特征在于该方法的步骤如下:步骤1)设计定制隐私保护的个性化信息检索系统的系统架构,并根据该系统架构选择相应的隐私保护模型;步骤2)实现步骤1)中隐私保护模型所需的多级语义粒度的用户模型,用于描述用户偏好,并在用户模型基础上定制用户隐私,分析攻击者模型和定义隐私保护目标;步骤3)开发支持隐私保护的个性化信息检索系统的通用框架,根据用户的隐私需求,使用数据泛化技术对用户模型进行定制泛化;步骤4)基于用户模型开发分别用于预测量化当前用户模型用于个性化检索的查询质量指标和隐私风险指标,将该两个指标融合为综合性能指标;同时开发用于预测量化特定检索歧义程度的指标,以实现用户模型泛化的自适应调节;步骤5)开发用户模型泛化方法,针对特定信息检索请求的特性,依据步骤4)开发的三个指标,生成泛化用户模型,并使用该泛化用户模型进行个性化信息检索。

【技术特征摘要】

【专利技术属性】
技术研发人员:陈珂寿黎但陈刚胡天磊柏壑
申请(专利权)人:浙江大学
类型:发明
国别省市:86

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1