查询维度信息的确定方法及装置制造方法及图纸

技术编号:16101847 阅读:73 留言:0更新日期:2017-08-29 22:32
本发明专利技术公开了一种查询维度信息的确定方法及装置。其中,该方法包括:获取与查询条件匹配的网页地址信息,其中,查询条件与查询维度对应;获取与网页地址信息对应的网页内容,其中,网页内容至少包括:文本信息、标签信息和文档对象模型中的一个或多个;根据网页内容,生成页面信息集合,其中,页面信息集合至少包括在网页内容中具有并列关系的页面信息;对页面信息集合中的各页面信息进行聚类分析,得到与查询维度对应的查询维度信息。本发明专利技术解决了由于查询的层次受主观影响,导致无法对查询维度进行深层次剖析的技术问题。

【技术实现步骤摘要】
查询维度信息的确定方法及装置
本专利技术涉及互联网领域,具体而言,涉及一种查询维度信息的确定方法及装置。
技术介绍
所谓查询维度,是指用于描述和概括一个查询中所包含的各种维度值的集合,其中,维度值是词或短语。通常,在一个查询中,包括多个查询维度,每个查询维度从不同侧描述了查询的本身。例如,以“电脑”作为查询条件,它包括的查询维度可以包括:品牌、类型、价格等,其各查询维度的值分别为:品牌(苹果、联想、戴尔等)、类型(台式、笔记本等)、价格(5000元以下、5000-10000元、10000元以上)等。查询维度为查询本身提供了各方面丰富的信息,一方面查询维度有助于全方面的反映查询的本身,另一方面用户可以很容易的根据某一维度,在该维度上对当前查询的内容进行更深度的查询。查询维度还可以作为例如AB测试等网页优化方法的重要参考。目前,往往通过建立索引来确定查询目标的相关信息。首先对于查询本身进行检索,然后返回满足查询逻辑的查询列表,并不会对查询的维度进行剖析,查询到的结果往往并不能准确的反映实际情况,并且在查询结果中,存在大量无效数据。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本本文档来自技高网
...
查询维度信息的确定方法及装置

【技术保护点】
一种查询维度信息的确定方法,其特征在于,包括:获取与查询条件匹配的网页地址信息,其中,所述查询条件与查询维度对应;获取与所述网页地址信息对应的网页内容,其中,所述网页内容至少包括:文本信息、标签信息和文档对象模型中的一个或多个;根据所述网页内容,生成页面信息集合,其中,所述页面信息集合至少包括在所述网页内容中具有并列关系的页面信息;对所述页面信息集合中的各所述页面信息进行聚类分析,得到与所述查询维度对应的查询维度信息。

【技术特征摘要】
1.一种查询维度信息的确定方法,其特征在于,包括:获取与查询条件匹配的网页地址信息,其中,所述查询条件与查询维度对应;获取与所述网页地址信息对应的网页内容,其中,所述网页内容至少包括:文本信息、标签信息和文档对象模型中的一个或多个;根据所述网页内容,生成页面信息集合,其中,所述页面信息集合至少包括在所述网页内容中具有并列关系的页面信息;对所述页面信息集合中的各所述页面信息进行聚类分析,得到与所述查询维度对应的查询维度信息。2.根据权利要求1所述的方法,其特征在于,对所述页面信息集合中的各所述页面信息进行聚类分析,得到与所述查询维度对应的查询维度信息,包括:分别将所述页面信息集合中的所述页面信息代入聚类模型得到聚类集合,并确定各所述页面信息与所述聚类集合之间的最大距离参数;根据所述最大距离参数小于或等于预先设置的阈值的所述页面信息,生成与所述查询维度对应的所述查询维度信息。3.根据权利要求2所述的方法,其特征在于,所述分别将所述页面信息集合中的所述页面信息代入聚类模型得到聚类集合,并确定各所述页面信息与所述聚类集合之间的最大距离参数包括:将所述页面信息集合中的第一页面信息和第二页面信息代入聚类模型,确定聚类集合;将所述页面信息集合中的第三页面信息与所述聚类集合进行比对,确定所述第三页面信息与所述聚类集合之间的最大距离参数。4.根据权利要求3所述的方法,其特征在于,在所述分别将所述页面信息集合中的所述页面信息代入聚类模型得到聚类集合,并确定各所述页面信息与所述聚类集合之间的最大距离参数中,采用以下方式确定所述页面信息间的距离参数:其中,l1,l2为具有并列关系的所述页面信息,d1(l1,l2)为在两个所述页面信息之间的距离参数,|l1∩l2|为在两个具有并列关系的所述页面信息中出现相同词语的词语数量;其中,dc(c1,c2)为所述页面信息集合中的所述页面信息之间的所述最大距离参数。5.根据权利要求1所述的方法,其特征在于,当所述网页内容中至少包括所述文本信息时,所述根据所述网页内容,生成页面信息集合,包括:以语句为单位对所述文本信息进行切分,得到语句集合;通过语义模型分别对所述语句集合中的语句进行处理,确定所述语句集合中具有并列关系的语句;根据所述语句集合...

【专利技术属性】
技术研发人员:何鑫
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1