基于兴趣偏好的内容主动呈现方法技术

技术编号：13825993 阅读：41 留言：0更新日期：2016-10-13 01:09

本发明专利技术提供了一种基于兴趣偏好的内容主动呈现方法，该方法包括：将用户的检索词提交给分布式检索系统；完成检索后，获取检索结果的所属领域表示；基于用户兴趣和检索结果所属领域的近似度，对检索结果进行排序。本发明专利技术提出了一种基于兴趣偏好的内容主动呈现方法，分布式检索系统对数据集进行统一收集管理，并基于用户的反馈和评价对检索结果进一步优化，更高效率地满足了用户个性化的需求。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据推送，特别涉及一种基于兴趣偏好的内容主动呈现方法。
技术介绍
在信息时代的今天，随着互联网技术和社会信息化技术的不断发展，信息量以爆炸式的速度增长，互联网正不断地影响和改变着人们的日常生活方式。然而，随着网络信息变得越来越纷繁复杂，人们如何从如此浩瀚的信息海洋中高效地找到符合需求的信息就成了一个越来越值得关注的课题。虽然有相关分布式检索系统可以帮助人们更精确的找到所需要的信息，但在某些应用领域，如电影、音乐、社交网络搜索，用户一般不能很好的提出很好的检索需求，通过研究用户的历史记录、用户的社会化信息以及对应领域数据的属性信息，将用户的信息建模或者领域数据资源建模，通过可靠方式将用户潜在感兴趣的数据资源推荐给用户。然而现有的分布式检索系统在工作效率和用户的满意度各不相同，并且缺少通用的接口来处理异构数据的输入。
技术实现思路
为解决上述现有技术所存在的问题，本专利技术提出了一种基于兴趣偏好的内容主动呈现方法，包括：将用户的检索词提交给分布式检索系统；完成检索后，获取检索结果的所属领域表示；基于用户兴趣和检索结果所属领域的近似度，对检索结果进行排序。优选地，所述将用户的检索词提交给分布式检索系统之后，还包括：获取分布式检索系统的检索结果，并提取出检索结果标题、描述和URL，
并进行分词，根据停用词表，将无用的词删除；根据逆向词频算法计算结果标题和描述的每个词的加权值，然后合并；检查每个词所属的细分领域，如果有两个词所属的细分领域相同，则将其加权值相加，作为该细分领域的加权值，最后可得到该检索结果的细分领域矢量；检查每个细分领域所...

【技术保护点】
一种基于兴趣偏好的内容主动呈现方法，其特征在于，包括：将用户的检索词提交给分布式检索系统；完成检索后，获取检索结果的所属领域表示；基于用户兴趣和检索结果所属领域的近似度，对检索结果进行排序。

【技术特征摘要】
1.一种基于兴趣偏好的内容主动呈现方法，其特征在于，包括：将用户的检索词提交给分布式检索系统；完成检索后，获取检索结果的所属领域表示；基于用户兴趣和检索结果所属领域的近似度，对检索结果进行排序。2.根据权利要求1所述的方法，其特征在于，所述将用户的检索词提交给分布式检索系统之后，还包括：获取分布式检索系统的检索结果，并提取出检索结果标题、描述和URL，并进行分词，根据停用词表，将无用的词删除；根据逆向词频算法计算结果标题和描述的每个词的加权值，然后合并；检查每个词所属的细分领域，如果有两个词所属的细分领域相同，则将其加权值相加，作为该细分领域的加权值，最后可得到该检索结果的细分领域矢量；检查每个细分领域所属的主领域，如果相同则继续合并，最后可得到该检索结果的主领域矢量；所述基于用户兴趣和检索结果所属领域的近似度，对检索结果进行排序，具体包括：定义UF为用户的主兴趣矢量，US为用户的细分兴趣矢量，DF是检索集中某个检索结果的主领域矢量，DS该检索结果的细分领域矢量，依次计算用户兴趣和每个结果的近似度：计算用户兴趣和检索结果的细分领域集合的边界差：BL＝DS-US∩DS计算用户兴趣和检索结果的细分领域集合的近似度： Sim L ( U S , D S ) = ( 1 - n u m ( B L ) / n u m ( D S ) ) × Σ i ∈ U S ∩ D S ...

【专利技术属性】
技术研发人员：董政，吴文杰，陈露，李学生，
申请(专利权)人：成都陌云科技有限公司，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人