查询条件相似度确定方法、对象查询方法及相关装置制造方法及图纸

技术编号:10050659 阅读:175 留言:0更新日期:2014-05-15 21:22
本申请公开了一种查询条件相似度确定方法、对象查询方法及相关装置,包括:获取查询点击日志,查询点击日志中包括各查询条件及对应点击的对象;并针对各查询条件中的每个查询条件,确定该查询条件对应点击的每个对象在该查询条件下被点击的次数;并根据确定的次数,确定每个查询条件的点击向量,其中,点击向量的分量为对象,分量值表征对象在该查询条件下被点击的情况;以及针对各查询条件中满足预设条件的每两个查询条件,根据其中第一查询条件的点击向量和第二查询条件的点击向量,确定第一查询条件与第二查询条件之间的相似度。采用本申请实施例提供的方案,提高了确定不同查询条件之间的相似度的准确性。

【技术实现步骤摘要】

本申请涉及互联网
和计算机
,尤其涉及一种查询条件相似度确定方法、对象查询方法及相关装置
技术介绍
在现有的互联网技术中,网站上一般会发布一些对象的信息,供登录该网站的用户浏览,以及进一步的针对特定对象的后续处理操作。例如,以电子商务网站为例,对象具体可以是卖家用户发布的产品,对象的信息具体可以是产品的描述信息,产品的属性信息,以及产品的购买信息等,登录电子商务网站的用户可以通过浏览发布产品的各种信息,了解该产品的详细情况,并可以进一步的执行收藏、购买或推荐给其他用户等处理操作;以社区网站为例,对象具体可以是社区用户发布的帖子,对象的信息具体可以是帖子的描述信息,帖子的内容信息等,登录社区网站的浏览用户可以通过浏览发布的帖子的各种信息,了解该帖子的详细情况,并可以进一步的执行收藏、回帖或推荐给其他用户等处理操作。目前,网站可以按照其设定方式在页面上向用户展现对象,如按照不同类目进行展现等,并且可以向用户提供对象查询的功能,即当接收到用户输入的查询条件后,从提供的对象全集中查询出满足该查询条件的对象,并将查询结果展现给用户,以供用户进一步的对查询结果包括的对象进行点击、浏览等操作,其中,查询条件可以是查询关键词。然而,在上述对象查询的过程中,经常由于不同用户的语言习惯,可能出现用户输入的查询条件所表达的查询意图不明确,从而导致所查询出的满足该查询条件的对象不准确、不全面。>为了解决上述问题,现有技术提出了基于各查询条件之间的相似度,确定查询条件的相似查询条件,并根据确定的相似查询条件进行对象查询的方案,即确定出与输入的查询条件相似的查询条件,并按照该相似的查询条件进行对象查询,将查询得到的对象作为本次查询结果的一部分,从而相比仅按照输入的查询条件进行对象查询,提高了查询结果的准确性和全面性。目前,在确定查询条件之间的相似度时,是根据各查询条件的文本内容是否相似进行确定,例如,从各查询条件的文本内容中提取中心词,并根据各查询条件的中心词之间的是否相同和近义,确定不同查询条件之间的相似度,将相似度满足预设条件的查询条件,作为相似查询条件。然而,基于查询条件的文本内容确定查询条件相似度的方案,仅能确定出有限的相似查询条件,而无法保证基于确定出的相似查询条件查询出的对象是用户希望得到的,并且,可能由于中心词提取的误差,以及对于词义理解的误差,导致确定的相似查询条件与输入的查询条件之间的相似度实质并不高,从而导致最终查询得到的对象仍然不准确和不全面。
技术实现思路
有鉴于此,本申请实施例提供一种查询条件相似度确定方法、对象查询方法及相关装置,用于解决现有技术中对于不同查询条件之间的相似度确定不准确的问题。本申请实施例通过如下技术方案实现:本申请实施例提供了一种查询条件相似度确定方法,包括:获取查询点击日志,所述查询点击日志中包括各查询条件及对应点击的对象;针对各查询条件中的每个查询条件,确定该查询条件对应点击的每个对象在该查询条件下被点击的次数;根据确定的次数,确定每个查询条件的点击向量,其中,点击向量的分量为对象,分量值表征对象在该查询条件下被点击的情况;针对各查询条件中满足预设条件的每两个查询条件,根据其中第一查询条件的点击向量和第二查询条件的点击向量,确定所述第一查询条件与所述第二查询条件之间的相似度。本申请实施例还提供了一种对象查询方法,包括:获得输入的当前查询条件;获取预先确定的与所述当前查询条件的相似度达到相似度阈值的相似查询条件;在对象全集中查询满足所述当前查询条件的对象,以及满足获取的所述相似查询条件的对象;其中,采用如下方式确定与所述当前查询条件的相似度达到相似度阈值的相似查询条件:获取查询点击日志,所述查询点击日志中包括所述当前查询条件和其它各查询条件及对应点击的对象;针对所述当前查询条件和其它各查询条件中的每个查询条件,确定该查询条件对应点击的每个对象在该查询条件下被点击的次数;根据确定的次数,确定每个查询条件的点击向量,其中,点击向量的分量为对象,分量值表征对象在该查询条件下被点击的情况;针对其它各查询条件中与所述当前查询条件满足预设条件的每个待确定查询条件,根据所述当前查询条件的点击向量和该待确定查询条件的点击向量,确定所述当前查询条件与该待确定查询条件之间的相似度;从各待确定查询条件中,确定与所述当前查询条件的相似度达到相似度阈值的查询条件,作为所述当前查询条件的相似查询条件。本申请实施例还提供了一种查询条件相似度确定装置,包括:日志获取单元,用于获取查询点击日志,所述查询点击日志中包括各查询条件及对应点击的对象;次数确定单元,用于针对各查询条件中的每个查询条件,确定该查询条件对应点击的每个对象在该查询条件下被点击的次数;向量确定单元,用于根据确定的次数,确定每个查询条件的点击向量,其中,点击向量的分量为对象,分量值表征对象在该查询条件下被点击的情况;相似度确定单元,用于针对各查询条件中满足预设条件的每两个查询条件,根据其中第一查询条件的点击向量和第二查询条件的点击向量,确定所述第一查询条件与所述第二查询条件之间的相似度。本申请实施例还提供了一种对象查询装置,包括:输入单元,用于获得输入的当前查询条件;条件获取单元,用于获取预先确定的与所述当前查询条件的相似度达到相似度阈值的相似查询条件;查询单元,用于在对象全集中查询满足所述当前查询条件的对象,以及满足获取的所述相似查询条件的对象;相似度确定单元,用于采用如下方式确定与所述当前查询条件的相似度达到相似度阈值的相似查询条件:获取查询点击日志,所述查询点击日志中包括所述当前查询条件和其它各查询条件及对应点击的对象;并针对所述当前查询条件和其它各查询条件中的每个查询条件,确定该查询条件对应点击的每个对象在该查询条件下被点击的次数;并根据确定的次数,确定每个查询条件的点击向量,其中,点击向量的分量为对象,分量值表征对象在该查询条件下被点击的情况;并针对其它各查询条件中与所述当前查询条件满足预设条件的每个待确定查询条件,根据所述当前查询条件的点击向量和该待确定查询条件的点击向量,确定所述当前查询条件与该待确定查询条件之间的相似度;以及从各待确定查询条件中,确定与所述当前查询条件的相似度达到相似度阈值的查询条件,作为所述当前查询条件的相似查询条件本文档来自技高网...
查询条件相似度确定方法、对象查询方法及相关装置

【技术保护点】
一种查询条件相似度确定方法,其特征在于,包括:获取查询点击日志,所述查询点击日志中包括各查询条件及对应点击的对象;针对各查询条件中的每个查询条件,确定该查询条件对应点击的每个对象在该查询条件下被点击的次数;根据确定的次数,确定每个查询条件的点击向量,其中,点击向量的分量为对象,分量值表征对象在该查询条件下被点击的情况;针对各查询条件中满足预设条件的每两个查询条件,根据其中第一查询条件的点击向量和第二查询条件的点击向量,确定所述第一查询条件与所述第二查询条件之间的相似度。

【技术特征摘要】
1.一种查询条件相似度确定方法,其特征在于,包括:
获取查询点击日志,所述查询点击日志中包括各查询条件及对应点击的对
象;
针对各查询条件中的每个查询条件,确定该查询条件对应点击的每个对象
在该查询条件下被点击的次数;
根据确定的次数,确定每个查询条件的点击向量,其中,点击向量的分量
为对象,分量值表征对象在该查询条件下被点击的情况;
针对各查询条件中满足预设条件的每两个查询条件,根据其中第一查询条
件的点击向量和第二查询条件的点击向量,确定所述第一查询条件与所述第二
查询条件之间的相似度。
2.如权利要求1所述的方法,其特征在于,根据确定的次数,确定每个
查询条件的点击向量,具体包括:
针对每个查询条件,确定该查询条件的点击向量的分量为该查询条件对应
点击的第一对象;
确定分量的分量值为该分量对应第一对象在该查询条件下被点击的次数。
3.如权利要求1所述的方法,其特征在于,根据确定的次数,确定每个
查询条件的点击向量,具体包括:
针对每个查询条件,确定该查询条件的点击向量的分量为该查询条件对应
点击的第一对象,以及对应点击所述第一对象的其它查询条件对应点击的对象
中,除所述第一对象之外的第二对象;
确定第一对象对应分量的分量值为该第一对象在该查询条件下被点击的
次数;
采用如下公式确定第二对象对应分量的分量值:
W(Q,bi)=(Σq∈Q(bi)q∈Q(qi)qNod(q)W(q,bi)Sum(q))*DecayFactor;]]>Nod(qi)=Σax∈A(Q)ax∈A(qi)axW(Q,ax)W(qi,ax)Sum(ax);]]>其中,Q为该查询条件,bi为所有第二对象中的第i个第二对象,W(Q,bi)为
该查询条件的点击向量中bi对应分量的分量值,Q(bi)为对应点击bi的查询条件
的集合,Q(qi)为对应点击对象中包括至少一个第一对象和至少一个第二对象的
所有查询条件的集合,qi为Q(qi)中的第i个查询条件,W(q,bi)为bi在查询条件q
下被点击的次数,Sum(q)为查询条件q对应点击的各对象在查询条件q下被点击
的次数的和值,DecayFactor为衰减因子,A(Q)为查询条件Q对应点击的对象的
集合,A(qi)为查询条件qi对应点击的对象的集合,W(Q,ax)为对象ax在查询条
件Q下被点击的次数,W(qi,ax)为对象ax在查询条件qi下被点击的次数,Sum(ax)
为对象ax分别在对应点击对象ax的各查询条件下被点击的次数的和值。
4.如权利要求1所述的方法,其特征在于,采用如下方式确定满足预设
条件的两个查询条件:
当两个查询条件各自对应点击的对象中存在至少一个相同对象时,确定该
两个查询条件满足预设条件。
5.如权利要求1所述的方法,其特征在于,根据其中第一查询条件的点
击向量和第二查询条件的点击向量,确定所述第一查询条件与所述第二查询条
件之间的相似度,具体包括:
当第一查询条件的点击向量的分量与第二查询条件的点击向量的分量相
同时,采用预设相似度算法确定所述第一查询条件的点击向量与所述第二查询
条件的点击向量之间的相似度,并将结果作为所述第一查询条件与所述第二查
询条件之间的相似度;
当第一查询条件的点击向量的分量与第二查询条件的点击向量的分量存
在不同时,确定所述第一查询条件的转换向量的分量和所述第二查询条件的转
换向量的分量,其中,所述第一查询条件的转换向量的分量,包括所述第一查
询条件的点击向量的分量,以及在所述第二查询条件的点击向量的分量中存在

\t且在所述第一查询条件的点击向量的分量中不存在的分量,所述第一查询条件
的转换向量的分量与所述第二查询条件的转换向量的分量相同;
针对所述第一查询条件的转换向量的每个分量,当该分量在所述第一查询
条件的点击向量中存在时,所述第一查询条件的转换向量的该分量的分量值为
所述第一查询条件的点击向量的该分量的分量值,否则,为0;
针对所述第二查询条件的转换向量的每个分量,当该分量在所述第二查询
条件的点击向量中存在时,所述第二查询条件的转换向量的该分量的分量值为
所述第二查询条件的点击向量的该分量的分量值,否则,为0;
采用预设相似度算法确定所述第一查询条件的转换向量与所述第二查询
条件的转换向量之间的相似度,并将结果作为所述第一查询条件与所述第二查
询条件之间的相似度。
6.一种对象查询方法,其特征在于,包括:
获得输入的当前查询条件;
获取预先确定的与所述当前查询条件的相似度达到相似度阈值的相似查
询条件;
在对象全集中查询满足所述当前查询条件的对象,以及满足获取的所述相
似查询条件的对象;
其中,采用如下方式确定与所述当前查询条件的相似度达到相似度阈值的
相似查询条件:
获取查询点击日志,所述查询点击日志中包括所述当前查询条件和其它各
查询条件及对应点击的对象;
针对所述当前查询条件和其它各查询条件中的每个查询条件,确定该查询
条件对应点击的每个对象在该查询条件下被点击的次数;
根据确定的次数,确定每个查询条件的点击向量,其中,点击向量的分量
为对象,分量值表征对象在该查询条件下被点击的情况;
针对其它各查询条件中与所述当前查询条件满足预设条件的每个待确定

\t查询条件,根据所述当前查询条件的点击向量和该待确定查询条件的点击向
量,确定所述当前查询条件与该待确定查询条件之间的相似度;
从各待确定查询条件中,确定与所述当前查询条件的相似度达到相似度阈
值的查询条件,作为所述当前查询条件的相似查询条...

【专利技术属性】
技术研发人员:周祥军郭瑞钟灵申月杨洁
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1