多级相关新闻的查找方法及装置制造方法及图纸

技术编号:15112961 阅读:73 留言:0更新日期:2017-04-09 03:26
本申请提供了一种多级相关新闻的查找方法及装置。多级相关新闻的查找方法包括:获取与第一检索词相关的一个或多个第二检索词;获取与一个或多个第二检索词匹配的一个或多个一级相关新闻;从一个或多个一级相关新闻中,确定与第一检索词匹配的二级相关新闻。根据本发明专利技术的多级相关新闻的查找方法及装置,利用多级检索词的相似关系,再基于熵的二级推荐方式,能够获取到与用户输入的检索词语义上相似的相关新闻。

【技术实现步骤摘要】

本专利技术涉及网络信息
,特别是多级相关新闻的查找方法及多级相关新闻的查找装置。
技术介绍
作为一种新兴的信息传播方式,网络新闻越来越深入到人们的生活中。随着网络新闻的急剧增加,其中包含了大量的信息,用户为了在海量的网络信息中寻找所需的信息,通常使用搜索引擎进行搜索。当前,用户利用自然语言进行新闻搜索时,主要是基于检索词来获取相关新闻,但是无法找到语义上相关但用词不同的新闻。
技术实现思路
鉴于上述问题,提出了一种多级相关新闻的查找方法及装置,通过多级相关查找,获得用户所需的更多相关新闻。根据本专利技术的一个方面,提供了一种多级相关新闻的查找方法,包括:获取与第一检索词相关的一个或多个第二检索词;获取与一个或多个第二检索词匹配的一个或多个一级相关新闻;从一个或多个一级相关新闻中,确定与第一检索词匹配的二级相关新闻。可选地,所述从一个或多个一级相关新闻中确定与第一检索词匹配的二级相关新闻,包括:确定所述一个或多个一级相关新闻的综合权重值;基于所述综合权重值,从所述一个或多个一级相关新闻中选取二级相关新闻。可选地,所述确定一个或多个一级相关新闻的综合权重值,包括:确定由所述第一检索词查找到所述一级相关新闻的第一检索权重;确定所述第一级相关新闻与所述第一检索词相匹配的第二检索权重;根据所述第一检索权重和所述第二检索权重,确定一级相关新闻的综合检索权重。可选地,所述确定由第一检索词查找到一级相关新闻的第一检索权重,包括:确定由第一检索词经过所述一个或多个第二检索词查找到一级相关新闻的第一检索权重。可选地,所述确定由第一检索词经过一个或多个第二检索词查找到一级相关新闻的第一检索权重,包括:根据所述第一检索词与所述一个或多个第二检索词中的一个第二检索词之间的相似度,确定第一检索概率;确定由所述一个或多个第二检索词中的一个第二检索词获得所述一级相关新闻的第二检索概率;确定所述第一检索权重为所述第一检索概率与所述第二检索概率的乘积的加和。可选地,所述第一检索概率为所述第一检索词与所述第二检索词的余弦相似度的平方。可选地,所述确定第一级相关新闻与第一检索词相匹配的第二检索权重,包括:根据所述一级相关新闻经由所述一个或多个第二检索词与所述第一检索词相匹配的第二检索词的个数,确定所述一级相关新闻的第二检索权重。可选地,所述第二检索权重是根据IDF算法获得。可选地,所述综合检索权重为所述第一检索权重与所述第二检索权重的乘积。根据本专利技术的另一个方面,提供了一种多级相关新闻的查找装置,包括:检索词获取模块,用于获取与第一检索词相关的一个或多个第二检索词;相关新闻获取模块,用于获取与所述一个或多个第二检索词匹配的一个或多个一级相关新闻;相关新闻确定模块,用于从所述一个或多个一级相关新闻中,确定与所述第一检索词匹配的二级相关新闻。可选地,相关新闻获取模块包括确定子模块和选取子模块,确定子模块确定所述一个或多个一级相关新闻的综合权重值,选取子模块基于所述综合权重值,从所述一个或多个一级相关新闻中选取二级相关新闻。可选地,确定子模块确定由所述第一检索词查找到所述一级相关新闻的第一检索权重;确定所述第一级相关新闻与所述第一检索词相匹配的第二检索权重;根据所述第一检索权重和所述第二检索权重,确定一级相关新闻的综合检索权重。可选地,确定子模块确定由第一检索词经过所述一个或多个第二检索词查找到一级相关新闻的第一检索权重。可选地,确定子模块根据所述第一检索词与所述一个或多个第二检索词中的一个第二检索词之间的相似度,确定第一检索概率;确定由所述一个或多个第二检索词中的一个第二检索词获得所述一级相关新闻的第二检索概率;确定所述第一检索权重为所述第一检索概率与所述第二检索概率的乘积的加和。可选地,确定子模块根据所述一级相关新闻经由所述一个或多个第二检索词与所述第一检索词相匹配的第二检索词的个数,确定所述一级相关新闻的第二检索权重。可选地,确定子模块确定综合检索权重为所述第一检索权重与所述第二检索权重的乘积。综上所述,根据本专利技术的多级相关新闻的查找方法及装置,利用多级检索词的相似关系,再基于熵的二级推荐方式,能够获取到与用户输入的检索词语义上相似的相关新闻。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1是根据本专利技术一个实施方式的多级相关新闻的查找方法的步骤流程图;图2是根据本专利技术一个实施方式的确定二级相关新闻的步骤流程图;图3示出了根据本专利技术实施例的多级相关新闻的查找方法的流程图;图4是根据本专利技术一个实施方式的多级查找的示意图;图5是根据本专利技术一个实施方式的多级相关新闻的查找装置的结构示意图。图6是根据本专利技术一个实施方式的相关新闻确定模块的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。参照图1,示出的根据本专利技术的多级相关新闻的查找方法包括以下步骤。11,获取与第一检索词相关的一个或多个第二检索词;当采用自然语言输入第一检索词,将获得一个或多个第二检索词。这些第二检索词与输入的第一检索词相关。第一检索词与第二检索词之间的关系,是通过大量用户的日志数据进行统计获得的。12,获取与所述一个或多个第二检索词匹配的一个或多个一级相关新闻;一旦获得一个或多个第二检索词,便能获取与一个或多个第二检索词相匹配的一个或多个一级相关新闻。容易理解,每个第二检索词都可以匹配出一个或多个一级相关新闻,其中的匹配满足一般规则。例如,本文档来自技高网...

【技术保护点】
一种多级相关新闻的查找方法,包括:获取与第一检索词相关的一个或多个第二检索词;获取与所述一个或多个第二检索词匹配的一个或多个一级相关新闻;从所述一个或多个一级相关新闻中,确定与所述第一检索词匹配的二级相关新闻。

【技术特征摘要】
1.一种多级相关新闻的查找方法,包括:
获取与第一检索词相关的一个或多个第二检索词;
获取与所述一个或多个第二检索词匹配的一个或多个一级相关新
闻;
从所述一个或多个一级相关新闻中,确定与所述第一检索词匹配
的二级相关新闻。
2.根据权利要求1所述的查找方法,其中所述从一个或多个一级
相关新闻中确定与第一检索词匹配的二级相关新闻,包括:
确定所述一个或多个一级相关新闻的综合权重值;
基于所述综合权重值,从所述一个或多个一级相关新闻中选取二
级相关新闻。
3.根据权利要求1或2中任一所述的查找方法,其中所述确定一
个或多个一级相关新闻的综合权重值,包括:
确定由所述第一检索词查找到所述一级相关新闻的第一检索权
重;
确定所述第一级相关新闻与所述第一检索词相匹配的第二检索权
重;
根据所述第一检索权重和所述第二检索权重,确定一级相关新闻
的综合检索权重。
4.根据权利要求1-3中任一所述的查找方法,其中所述确定由第
一检索词查找到一级相关新闻的第一检索权重,包括:
确定由第一检索词经过所述一个或多个第二检索词查找到一级相
关新闻的第一检索权重。
5.根据权利要求1-4中任一所述的查找方法,其中所述确定由第
一检索词经过一个或多个第二检索词查找到一级相关新闻的第一检索
权重,包括:
根据所述...

【专利技术属性】
技术研发人员:张伸正魏少俊陈培军
申请(专利权)人:北京奇虎科技有限公司奇智软件北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1