基于兴趣偏好的内容主动呈现方法技术

技术编号:13825993 阅读:41 留言:0更新日期:2016-10-13 01:09
本发明专利技术提供了一种基于兴趣偏好的内容主动呈现方法,该方法包括:将用户的检索词提交给分布式检索系统;完成检索后,获取检索结果的所属领域表示;基于用户兴趣和检索结果所属领域的近似度,对检索结果进行排序。本发明专利技术提出了一种基于兴趣偏好的内容主动呈现方法,分布式检索系统对数据集进行统一收集管理,并基于用户的反馈和评价对检索结果进一步优化,更高效率地满足了用户个性化的需求。

【技术实现步骤摘要】

本专利技术涉及数据推送,特别涉及一种基于兴趣偏好的内容主动呈现方法
技术介绍
在信息时代的今天,随着互联网技术和社会信息化技术的不断发展,信息量以爆炸式的速度增长,互联网正不断地影响和改变着人们的日常生活方式。然而,随着网络信息变得越来越纷繁复杂,人们如何从如此浩瀚的信息海洋中高效地找到符合需求的信息就成了一个越来越值得关注的课题。虽然有相关分布式检索系统可以帮助人们更精确的找到所需要的信息,但在某些应用领域,如电影、音乐、社交网络搜索,用户一般不能很好的提出很好的检索需求,通过研究用户的历史记录、用户的社会化信息以及对应领域数据的属性信息,将用户的信息建模或者领域数据资源建模,通过可靠方式将用户潜在感兴趣的数据资源推荐给用户。然而现有的分布式检索系统在工作效率和用户的满意度各不相同,并且缺少通用的接口来处理异构数据的输入。
技术实现思路
为解决上述现有技术所存在的问题,本专利技术提出了一种基于兴趣偏好的内容主动呈现方法,包括:将用户的检索词提交给分布式检索系统;完成检索后,获取检索结果的所属领域表示;基于用户兴趣和检索结果所属领域的近似度,对检索结果进行排序。优选地,所述将用户的检索词提交给分布式检索系统之后,还包括:获取分布式检索系统的检索结果,并提取出检索结果标题、描述和URL,
并进行分词,根据停用词表,将无用的词删除;根据逆向词频算法计算结果标题和描述的每个词的加权值,然后合并;检查每个词所属的细分领域,如果有两个词所属的细分领域相同,则将其加权值相加,作为该细分领域的加权值,最后可得到该检索结果的细分领域矢量;检查每个细分领域所属的主领域,如果相同则继续合并,最后可得到该检索结果的主领域矢量;所述基于用户兴趣和检索结果所属领域的近似度,对检索结果进行排序,具体包括:定义UF为用户的主兴趣矢量,US为用户的细分兴趣矢量,DF是检索集中某个检索结果的主领域矢量,DS该检索结果的细分领域矢量,依次计算用户兴趣和每个结果的近似度:计算用户兴趣和检索结果的细分领域集合的边界差:BL=DS-US∩DS计算用户兴趣和检索结果的细分领域集合的近似度: Sim L ( U S , D S ) = ( 1 - n u m ( B L ) / n u m ( D S ) ) × Σ i ∈ U S ∩ D S ( dsw i × usw i ) ]]>其中是该检索结果和用户兴趣中都存在的细分领域的权值乘积的和,num(BL)和num(DS)分别是BL和DS的数量;计算用户兴趣和检索结果的主领域集合的边界差:BU=DF-(UF∩DF)计算用户兴趣和检索结果的主领域集合的近似度: Sim U ( U F , D F ) = ( 1 - n u m ( B U ) / n u m ( D F ) ) × Σ i ∈ U S ∩ D S ( dfw i × ufw i ) ]]>其中是该检索结果和用户兴趣中都存在的主领域的权值
乘积的和,num(BU)和num(DF)分别是BU和DF的数量;最后计算该检索结果和用户兴趣的总近似度:Sim=ζ×SimL(US,DS)+(1-ζ)×SimU(UF,DF)其中ζ为细分领域集合近似度的加权值;对分布式检索系统返回的每个结果依次计算总近似度Sim,得到每个检索结果新的权值,然后从大到小排序。本专利技术相比现有技术,具有以下优点:本专利技术提出了一种基于兴趣偏好的内容主动呈现方法,分布式检索系统对数据集进行统一收集管理,并基于用户的反馈和评价对检索结果进一步优化,更高效率地满足了用户个性化的需求。附图说明图1是根据本专利技术实施例的基于兴趣偏好的内容主动呈现方法的流程图。具体实施方式下文与图示本专利技术原理的附图一起提供对本专利技术一个或者多个实施例的详细描述。结合这样的实施例描述本专利技术,但是本专利技术不限于任何实施例。本专利技术的范围仅由权利要求书限定,并且本专利技术涵盖诸多替代、修改和等同物。在下文描述中阐述诸多具体细节以便提供对本专利技术的透彻理解。出于示例的目的而提供这些细节,并且无这些具体细节中的一些或者所有细节也可以根据权利要求书实现本专利技术。本专利技术的一方面提供了一种基于兴趣偏好的内容主动呈现方法。图1是根据本专利技术实施例的基于兴趣偏好的内容主动呈现方法流程图。本专利技术在分布式检索系统中对于检索输入数据集进行统一的管理与存储,并且对其进行数据转换,根据获得的反馈结果进行结果评价,分布式检索系统
评价单元包括数据管理模块、检索执行模块和展现模块。数据管理模块用于接收数据输入、统一格式以及数据集的特征分析和采样。数据文件输入系统后,经过数据管理模块的数据汇总子模块将其转换成系统可识别的数据资源,经过数据整理子模块处理,成为系统可计算的数据,数据整理包括将来自文本文件,数据库文件,以及日志文件的输入数据进行格式的统一,转换为二维矩阵或多维列表,以使后续的数据操作继续执行。在检索执行模块请求数据的时候,检索执行模块在对应的请求参数中包含请求数据的格式,然后数据传输子模块根据该参数来处理经过数据采样的数据。数据集根据各服务器的存储情况存储在不同的服务器上,检索执行模块向数据管理模块请求数据时,数据管理模块先进行缓存查找,采用的是客户端的散列策略,如果缓存命中,直接从缓存中将数据集取出,若不命中,则在数据库中请求相关数据。在数据管理模块访问缓存服务器时,首先,数据管理模块请求数据集时的本文档来自技高网
...

【技术保护点】
一种基于兴趣偏好的内容主动呈现方法,其特征在于,包括:将用户的检索词提交给分布式检索系统;完成检索后,获取检索结果的所属领域表示;基于用户兴趣和检索结果所属领域的近似度,对检索结果进行排序。

【技术特征摘要】
1.一种基于兴趣偏好的内容主动呈现方法,其特征在于,包括:将用户的检索词提交给分布式检索系统;完成检索后,获取检索结果的所属领域表示;基于用户兴趣和检索结果所属领域的近似度,对检索结果进行排序。2.根据权利要求1所述的方法,其特征在于,所述将用户的检索词提交给分布式检索系统之后,还包括:获取分布式检索系统的检索结果,并提取出检索结果标题、描述和URL,并进行分词,根据停用词表,将无用的词删除;根据逆向词频算法计算结果标题和描述的每个词的加权值,然后合并;检查每个词所属的细分领域,如果有两个词所属的细分领域相同,则将其加权值相加,作为该细分领域的加权值,最后可得到该检索结果的细分领域矢量;检查每个细分领域所属的主领域,如果相同则继续合并,最后可得到该检索结果的主领域矢量;所述基于用户兴趣和检索结果所属领域的近似度,对检索结果进行排序,具体包括:定义UF为用户的主兴趣矢量,US为用户的细分兴趣矢量,DF是检索集中某个检索结果的主领域矢量,DS该检索结果的细分领域矢量,依次计算用户兴趣和每个结果的近似度:计算用户兴趣和检索结果的细分领域集合的边界差:BL=DS-US∩DS计算用户兴趣和检索结果的细分领域集合的近似度: Sim L ( U S , D S ) = ( 1 - n u m ( B L ) / n u m ( D S ) ) × Σ i ∈ U S ∩ D S ...

【专利技术属性】
技术研发人员:董政吴文杰陈露李学生
申请(专利权)人:成都陌云科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1