一种搜索方法和系统技术方案

技术编号:9927759 阅读:76 留言:0更新日期:2014-04-16 18:42
本发明专利技术提供了一种搜索方法和系统,涉及计算机技术领域。所述方法包括:接收用户端的查询词串;根据所述查询词串检索与查询词串相关的各产品信息;查找各产品信息所属的产品提供方,或者查找各产品信息所属的产品提供方和各产品信息所属领域;提取各产品信息对应的第一置信度,所述第一置信度为所述产品信息在所属产品提供方的置信度,或提取各产品信息对应的第二置信度,所述第二置信度为所述产品信息在所属产品提供方中,所述产品信息的所属领域的置信度;将所述第一置信度或第二置信度加入排序权重,并将各产品信息进行排序;将排序后的产品信息输出给用户端。本申请使得搜索得到的产品结果排序更接近实际需求,减少了冗余数据处理过程。

【技术实现步骤摘要】
【专利摘要】本专利技术提供了一种搜索方法和系统,涉及计算机
。所述方法包括:接收用户端的查询词串;根据所述查询词串检索与查询词串相关的各产品信息;查找各产品信息所属的产品提供方,或者查找各产品信息所属的产品提供方和各产品信息所属领域;提取各产品信息对应的第一置信度,所述第一置信度为所述产品信息在所属产品提供方的置信度,或提取各产品信息对应的第二置信度,所述第二置信度为所述产品信息在所属产品提供方中,所述产品信息的所属领域的置信度;将所述第一置信度或第二置信度加入排序权重,并将各产品信息进行排序;将排序后的产品信息输出给用户端。本申请使得搜索得到的产品结果排序更接近实际需求,减少了冗余数据处理过程。【专利说明】一种搜索方法和系统
本申请涉及计算机
,特别是涉及一种搜索方法和系统。
技术介绍
搜索引擎技术的发展是随着电子技术不断进步而形成的信息数字化和数据网络化的必然产物。一个出色的搜索引擎能够及时准确的向用户提供所需要的信息。Google搜索引擎依靠其Page Rank机制及收敛算法一直处在该领域的领先地位,其体系结构代表了该搜索领域的传统搜索引擎。但随着互联网快速、细分的发展,需要对于各方向的网络信息的搜索具有更加精确、更加专业、更具深度的搜索,而传统搜索引擎的排名技术显然不适用于专业垂直搜索的需求,比如在B2B电子商务垂直搜索等产品垂直搜索领域,基于互联网的产品搜索服务器需要将散布于互联网的各产品与相关数据搜集起来,提供统一的检索服务,因此产品数据的检索功能对于整体业务而言是非常重要的,产品数据的检索方法既要满足产品数据的检索这样一个特定的要求,又要具有很高的性能。以电子商务为例,用户希望通过搜索获得所需产品的相关信息并较好的完成交易。从计算机数据处理的过程来看,具体包括以下过程:计算机针对用户搜索需求给出产品反馈信息,用户查看产品相关信息并确定交易,计算机依据用户指示完成交易(当采用电子货币购买电子商品或者虚拟物品时,则全部过程为互联网上的数据处理过程;当购买实物时,则上述过程可能会涉及到一些线下过程)。上述数据处理过程中,当搜索的产品信息的结果排序不符合实际需求时,则用户为了完成交易(完成整个数据处理过程),则可能需要点击很多搜索结果,从而可能导致信息处理过程的冗余、服务器浪费和效率降低。即迫切需要本领域技术人员解决的技术问题是:如何才能减少或者避免由于搜索结果排序不优化,而导致的信息处理过程的冗余、服务器浪费和效率降低。
技术实现思路
本申请所要解决的技术问题是提供一种搜索方法和系统,解决现有技术中由于产品信息置信度导致的信息不够精确,从而导致服务器负载压力大,用户搜索成本高的缺点;能精确返回用户需求的产品信息,从而降低服务器负载压力,降低用户的搜索成本。为了解决上述问题,本申请公开了一种搜索方法,包括:接收用户端的查询词串;根据所述查询词串检索与查询词串相关的各产品信息;查找各产品信息所属的产品提供方,或者查找各产品信息所属的产品提供方和各产品信息所属领域;提取各产品信息对应的第一置信度,所述第一置信度为所述产品信息在所属产品提供方的置信度,或提取各产品信息对应的第二置信度,所述第二置信度为所述产品信息在所属产品提供方中,所述产品信息的所属领域的置信度;其中,所述每个产品信息的第一置信度通过分析所属产品提供方的该产品信息对应的行为记录表获得,所述每个产品信息对应的第二置信度通过分析所述产品提供方在该产品信息所属领域内的各产品信息的行为记录表获得;将所述第一置信度或第二置信度加入排序权重,并将各产品信息进行排序;将排序后的产品信息输出给用户端。优选的,所述每个产品信息的第一置信度通过分析所属产品提供方的该产品信息对应的行为记录表获得包括:针对每一产品提供方,提取所述产品提供方各产品信息对应的各种行为记录表;所述各种行为记录表包括所述各产品信息的对应的交易行为记录表、评价行为记录表、和/或收藏行为记录表;针对每一所述产品信息,分析统计所述产品信息对应的各种行为记录表,获得各种特征维度下的特征值;将所述各种特征值向量化为一个特征向量,将所述各种特征值相应的权重对应向量化为一个权重向量,并利用所述特征向量和权重向量计算所述产品信息的第一置信度。优选的,所述每个产品信息对应的第二置信度通过分析所述产品提供方在该产品信息所属领域内的各产品信息的行为记录表获得包括:针对每一产品提供方,提取所述产品提供方的各产品信息的核心产品词,并提取所述产品提供方各产品信息对应的各种行为记录表;所述各种日志记录表包括所述各产品信息的对应的各交易行为记录表、各评价行为记录表、和/或各收藏行为记录表;根据所述核心产品词,确定属于同一领域的各条产品信息;针对每一领域,分析统计所述领域内各产品信息对应的各种行为记录表,获得各种特征维度下的特征值;将所述各种特征值向量化为一个特征向量,将所述各种特征值相应的权重对应向量化为一个权重向量,并利用所述特征向量和权重向量计算所述产品信息对应的第二置信度。优选的,分析统计所述产品信息对应的各种行为记录表,获得各种特征维度下的特征值包括:通过分析交易行为记录表,获得包括交易次数对应特征维度下的特征值;通过分析评价行为记录表,获得包括好评率对应特征维度下的特征值;通过分析收藏行为记录表,获得包括收藏次数对应特征维度下的特征值。优选的,所述各种特征值相应的权重获得步骤包括:对于每一个特征维度,选择所述特征维度下的原始样本使用极大似然估计构造出目标函数F(X);选择所述特征维度下的初始权重\,并结合目标函数F(X)构造搜索方向Pt和步长因子St ;根据Wt+1 = fft+stPt迭代求出下一个迭代点Wt+1,当基于Wt+1的F(X)值与基于Wt的F(X)值之间的差值的绝对值小于阈值,则将Wt+1作为所述特征维度下的权重。优选的,提取所述产品提供方的各产品信息的核心产品词包括:提取所述产品信息的标题信息;对标题信息进行切词和词性标注;依据各词的词性及修饰关系确认所述产品信息的核心产品词。优选的,根据所述查询词串检索与查询词串相关的各产品信息包括:将所述查询词串进行分词操作;基于得到的各分词进行扩展,得到扩展词;通过各分词和扩展词在索引中检索获得各产品信息。优选的,将所述第一置信度或第二置信度加入排序权重,将各产品信息进行排序包括:计算所述各产品信息与所述查询词串的文本相关性值;计算所述各产品信息的所属领域与所述查询词串的领域相关性值;利用各产品信息的第一置信度或第二置信度、相应的文本相关性值、领域相关性值计算总相关性值;基于所述总相关性值对各产品信息进行排序。相应的,本申请还公开了一种搜索系统,包括:查询接收模块,用于接收用户端的查询词串;检索模块,用于根据所述查询词串检索与查询词串相关的各产品信息;查找模块,用于查找各产品信息所属的产品提供方,或者查找各产品信息所属的产品提供方和各产品信息所属领域;置信度提取模块,用于提取各产品信息第一置信度,所述第一置信度为所述产品信息在所属产品提供方的置信度、或提取各产品信息的第二置信度,所述第二置信度为所述产品信息在所属产品提供方中,所述产品信息的所属领域的置信度;其中,所述每个产品信息的第一置信度通过分析所属产品提供本文档来自技高网
...

【技术保护点】
一种搜索方法,其特征在于,包括:接收用户端的查询词串;根据所述查询词串检索与查询词串相关的各产品信息;查找各产品信息所属的产品提供方,或者查找各产品信息所属的产品提供方和各产品信息所属领域;提取各产品信息对应的第一置信度,所述第一置信度为所述产品信息在所属产品提供方的置信度,或提取各产品信息对应的第二置信度,所述第二置信度为所述产品信息在所属产品提供方中,所述产品信息的所属领域的置信度;其中,所述每个产品信息的第一置信度通过分析所属产品提供方的该产品信息对应的行为记录表获得,所述每个产品信息对应的第二置信度通过分析所述产品提供方在该产品信息所属领域内的各产品信息的行为记录表获得;将所述第一置信度或第二置信度加入排序权重,并将各产品信息进行排序;将排序后的产品信息输出给用户端。

【技术特征摘要】

【专利技术属性】
技术研发人员:宋超陈超冯景华郭宁
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1