一种商品信息搜索方法和系统技术方案

技术编号:9667923 阅读:95 留言:0更新日期:2014-02-14 06:22
本申请提供了一种商品信息搜索方法和系统,涉及网络技术领域。所述方法包括:提供商品信息和针对该商品信息的各初始关键词;服务器接收查询词;基于所述查询词,针对商品信息的内容进行检索,获得初始商品集合;对于所述初始商品集合中部分或全部待计算的商品信息,获取每条待计算商品信息对应的各初始关键词;针对待计算的商品信息的各初始关键词,计算所述各初始关键词与所述查询词的第一相关性,和各初始关键词与所述商品信息的第二相关性;根据所述第一相关性和第二相关性,对待计算的商品信息进行排序;返回排序靠前待计算的商品信息。本申请减少了信息的流失程度,降低了搜索引擎的搜索和排序压力,提高了检索出的商品信息的正确性。

【技术实现步骤摘要】
一种商品信息搜索方法和系统
本申请涉及网络
,特别是涉及一种商品信息搜索方法和系统。
技术介绍
随着互联网的发展,互联网提供的信息已经越来越多样化,而通过互联网投放商品信息也成为商品信息客户的重要选择。在互联网中投放商品信息的服务不但可以为商品信息客户进行宣传,而且可以为客户提供更多的服务信息。互联网搜索引擎作为信息服务平台,通过搜索引擎投放商品信息也已经成为商品信息客户普遍采用的一种商品信息投放方式。在现有技术中,商品信息客户登录搜索引擎提供的商品信息推广系统,设置需要推广的商品信息链接网站或者网页,并选择一组关键词作为这个页面推广需要的竞价词。搜索引擎以这些商品信息客户注册的检索关键词建立关键词索引,关键词包括用户选择的关键词,而每个关键词索引的是商品信息客户推广的页面,即搜索引擎以这些商品信息客户注册的检索关键词建立扩展词库,当搜索引擎接收到用户端的查询词之后,会根据所述的扩展词库中选择与所述查询词相关的各检索关键词,然后再首先基于检索关键词与商品信息客户网站或者网页的关联性,将与各检索关键词相关的所有商品信息客户的商品信息进行检索,最后以查询词与各商品信息的相关性和商品本文档来自技高网...
一种商品信息搜索方法和系统

【技术保护点】
一种商品信息搜索方法,其特征在于,包括:提供商品信息和针对该商品信息的各初始关键词;服务器接收查询词;基于所述查询词,针对商品信息的内容进行检索,获得初始商品集合;对于所述初始商品集合中部分或全部待计算的商品信息,获取每条待计算商品信息对应的各初始关键词;针对待计算的商品信息的各初始关键词,计算所述各初始关键词与所述查询词的第一相关性,和各初始关键词与所述商品信息的第二相关性;根据所述第一相关性和第二相关性,对待计算的商品信息进行排序;返回排序靠前的至少一条待计算的商品信息。

【技术特征摘要】
1.一种商品信息搜索方法,其特征在于,包括:提供商品信息和针对该商品信息的各初始关键词;服务器接收查询词;基于所述查询词,针对商品信息的内容进行检索,获得初始商品集合;对于所述初始商品集合中部分或全部待计算的商品信息,获取每条待计算商品信息对应的各初始关键词;针对待计算的商品信息的各初始关键词,计算所述各初始关键词与所述查询词的第一相关性,和各初始关键词与所述商品信息的第二相关性;根据所述第一相关性和第二相关性,对待计算的商品信息进行排序;返回排序靠前的至少一条待计算的商品信息。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一相关性和第二相关性,对待计算的商品信息进行排序,具体包括:根据所述各初始关键词的第一相关性和第二相关性计算各初始关键词对应所述商品信息的第一总相关性;根据所述第一总相关性,对待计算的商品信息进行排序。3.根据权利要求2所述的方法,其特征在于,在服务器接收查询词之前,还提供各初始关键词的权值,所述根据所述第一总相关性对待计算的商品信息进行排序,具体包括:将第一总相关性最高的初始关键词作为相应商品信息的排序关键词;计算所述查询词与各待计算的商品信息的第三相关性;针对所述初始商品集合中每条待计算商品信息,结合相应第三相关性和排序关键词的权值,计算所述查询词与所述各商品信息的第二总相关性;以第二总相关性对所述各待计算的商品信息进行排序。4.根据权利要求1所述的方法,其特征在于,所述计算所述各初始关键词与所述查询词的第一相关性,具体包括:计算所述初始关键词与查询词相同的词的字符长度占所述查询词字符长度的长度占比;根据从所述初始关键词变换到查询词的操作次数,计算从所初始关键词到所述查询词的编辑距离;结合所述占比和所述编辑距离,计算所述初始关键词与所述查询词的第一相关性。5.根据权利要求1所述的方法,其特征在于,所述计算所述各初始关键词与所述查询词的第一相关性包括:获取网络搜索日志,分析所述网络搜索日志中所述查询词的点击情况,并分析以所述初始关键词为查询词时的点击情况;将所述查询词的点击情况向量化为第一向量,并将所述初始关键词的点击情况向量化为第二向量;计算所述第一向量和第二向量之间的夹角值,并将所述夹角值作为第一相关性。6.根据权利要求1所述的方法,其特征在于,所述各初始关键词与所述商品信息的第二相关性,具体包括:统计所述初始关键词在所述商品信息包括的文本信息中的字符串占比;...

【专利技术属性】
技术研发人员:钟灵
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1