本发明专利技术提供了一种搜索方法及其装置,其中的方法具体包括:依据搜索查询请求,得到针对搜索对象的类别的搜索结果;分别依据跨类别排序特征和各类别的类别内排序特征,对各类别下的搜索结果进行分排序,得到每个搜索对象的跨类别排序特征值和分类别排序结果;依据每个搜索对象的跨类别排序特征值和分类别排序结果,进行混合排序,得到的混合排序结果中跨类别排序特征值大的搜索对象排在跨类别排序特征值小的搜索对象的前面,每个搜索对象在混合排序结果中的相对位置与该每个搜索对象在分类别排序结果中的相对位置相同;将混合排序结果作为搜索结果返回给用户。本申请能够使排序结果更加贴近用户的搜索需求,降低服务器的负担,网络带宽资源的占用。
【技术实现步骤摘要】
一种搜索方法及其装置
本专利技术涉及搜索引擎
,特别是涉及一种搜索方法及其装置。
技术介绍
目前,面对大量的购物网站,搜索引擎一般首先利用爬虫将这些购物网站的商品信息抓取到自己的数据库中进行存储。由于不同类型的购物网站会有不同的特征,一般地,一个优秀的搜索引擎会将反映这些购物网站的不同特征的商品信息全都抓取下来。例如,团购网站的时效性很强,故需要把团购商品的上线时间抓取下来;又如,用户对3C(计算机、通讯和消费电子产品,Computer、Communication、ConsumerElectronic)数码等类型购物网站的售后保障比较关心,因此也需要把售后服务的相关信息抓取下来。对抓取来的商品数据进行离线处理后,搜索引擎就可以针对这些处理后的商品信息建立索引,为用户提供检索服务。搜索引擎的一个重要功能就是对搜索结果进行排序,有效的排序能够把对用户有用的商品排列到搜索结果的前面,能够让用户尽快找到所需的商品,减少用户的寻找时间,从而提升用户的搜索体验。由于不同类型的购物网站会有不同的特征,导致很多特征不是全部的商品都具有,不具有普遍性。如果在一个排序模型中采用所有的特征,会出现搜索结果页中某一类型的商品相对集中展现的情况。因此,现有一种搜索方法在一个排序模型中采用较少的几个特征作为排序特征,如商品的标题、商品的价格,商品的成交笔数等,由于这些排序特征是普遍的基本特征,所以可以利用这些排序特征对每件商品进行评分,然后进行排序后返回给用户。但是,由于在排序模型中采用的排序特征较少,很难满足普通用户尤其是深度购物用户的需求。例如,在电子数码消费类商品中,如果不把售后服务这一特征包含到排序模型中,那么就不能确保把那些售后服务较好的商品排到前面去。这样,购物用户就需要多次翻页才能找到合适的商品,这不但增加了服务器的负担,而且增加了网络带宽资源的占用,并且严重影响了用户的搜索体验。总之,需要本领域技术人员迫切解决的一个技术问题就是:如何能够使搜索结果更加贴近用户的搜索需求,降低服务器的负担和网络带宽资源的占用,并提升用户的搜索体验。
技术实现思路
本专利技术所要解决的技术问题是提供一种搜索方法及其装置,能够使排序结果更加贴近用户的搜索需求,降低服务器的负担,网络带宽资源的占用,从而提升用户的搜索体验。为了解决上述问题,本专利技术公开了一种搜索方法,包括:接收用户的搜索查询请求;依据所述搜索查询请求,得到相应的针对搜索对象的类别的搜索结果,其中,所述搜索结果的类别与所述搜索对象的类别相应;分别依据跨类别排序特征和各类别的类别内排序特征,对各类别下的搜索结果进行分排序,得到每个搜索对象的跨类别排序特征值和分类别排序结果;其中,各类别下的搜索结果使用相同的跨类别排序特征;依据每个搜索对象的跨类别排序特征值和分类别排序结果,对所有类别下的搜索结果进行混合排序,得到的混合排序结果中跨类别排序特征值大的搜索对象排在跨类别排序特征值小的搜索对象的前面,以及,每个搜索对象在混合排序结果中的相对位置与该每个搜索对象在分类别排序结果中的相对位置相同;将所述混合排序结果作为搜索结果返回给用户。优选的,所述依据所述搜索查询请求,得到相应的针对搜索对象的类别的搜索结果的步骤,包括:依据所述搜索查询请求,检索匹配得到相应的针对搜索对象的搜索结果;依据所述搜索对象的类别,将所述搜索结果归类到相应的类别。优选的,所述依据所述搜索查询请求,检索匹配得到相应的针对搜索对象的类别的搜索结果的步骤,包括:依据所述搜索查询请求,分别针对搜索对象的类别,检索匹配得到相应类别下的搜索结果。优选的,所述对所有类别下的搜索结果进行混合排序的步骤,包括:在两个或多个搜索对象的跨类别排序特征值相同时,采用固定特征对两个或多个搜索对象的搜索结果进行排序;或者,在两个或多个搜索对象的跨类别排序特征值相同时,采用随机特征对两个或多个搜索对象的搜索结果进行排序。优选的,所述采用随机特征对两个或多个搜索对象的搜索结果进行排序的步骤,包括:依据与所述搜索结果相应的搜索查询请求,确定随机种子;在两个或多个搜索对象的跨类别排序特征值相同时,依据所述随机种子生成一个伪随机序列,其中,所述伪随机序列的长度等于跨类别排序特征值相同的搜索对象的个数;依据该伪随机序列对所述两个或多个搜索对象进行混合排序。优选的,所述跨类别排序特征包括文本相关性特征,所述文本相关性特征表示搜索查询请求所涉及的文本与所述搜索对象的描述文本之间的关联程度,其中,所述搜索查询请求与与所述搜索结果相应。优选的,在所述搜索对象为商品时,所述跨类别排序特征包括如下特征中的一种或多种:商品搜索查询请求所涉及的文本与商品的描述文本之间的相关性特征、商品是否支持货到付款、商品所在店铺是否为旗舰店、商品所在店铺的规模和商品品牌的知名度。优选的,在所述搜索对象为商品时,所述搜索对象的类别包括如下类别中的一种或多种:团购类、服饰类和数码类;团购类的类别内排序特征包括如下特征中的一种或多种:商品名、价格、评价和发布时间;服饰类的类别内排序特征包括如下特征中的一种或多种:商品名、价格、评价和新款;数码类的类别内排序特征包括如下特征中的一种或多种:商品名、价格、评价和售后服务。优选的,所述对所有类别下的搜索结果进行混合排序的步骤,包括:步骤1:分别依据各类别的分类别排序结果中,从各类别下的搜索结果取出排在最前面的一个,放到第一存储模块中;步骤2:从所述第一存储模块中选择跨类别排序特征值最大的搜索结果,放到第二存储模块中;步骤3:从所述第二存储模块中随机选取一个搜索结果,放在混合排序结果的末尾;步骤4:依据排在混合排序结果末尾的搜索结果,对所述第一存储模块和/或所述第二存储模块和/或各类别下的搜索结果进行更新,并依据更新结果重复执行步骤2到步骤4,直至所有类别下的搜索结果均为空;步骤5:在所有类别下的搜索结果均为空时,输出所述混合排序结果。另一方面,本申请还公开了一种搜索装置,包括:接口模块,用于接收用户的搜索查询请求;获取模块,用于依据所述搜索查询请求,得到相应的针对搜索对象的类别的搜索结果,其中,所述搜索结果的类别与所述搜索对象的类别相应;分排序模块,用于分别依据跨类别排序特征和各类别的类别内排序特征,对各类别下的搜索结果进行分排序,得到每个搜索对象的跨类别排序特征值和分类别排序结果;其中,各类别下的搜索结果使用相同的跨类别排序特征;混合排序模块,用于依据每个搜索对象的跨类别排序特征值和分类别排序结果,对所有类别下的搜索结果进行混合排序,得到的混合排序结果中跨类别排序特征值大的搜索对象排在跨类别排序特征值小的搜索对象的前面,以及,每个搜索对象在混合排序结果中的相对位置与该每个搜索对象在分类别排序结果中的相对位置相同;及返回模块,用于将所述混合排序结果作为搜索结果返回给用户。与现有技术相比,本专利技术具有以下优点:本申请将所述跨类别排序特征应用于搜索结果的排序全过程,并将排序全过程分为两个阶段:各类别下搜索结果的分排序和所有类别下搜索结果的混合排序;由于所述排序全过程充分考虑了各某类别搜索对象的尽可能多的类别内排序特征,所以最终得到的混合排序结果能够更加贴近用户的搜索需求,提升用户的搜索体验;并且,最终得到的混合排序结果中跨本文档来自技高网...

【技术保护点】
一种搜索方法,其特征在于,包括:接收用户的搜索查询请求;依据所述搜索查询请求,得到相应的针对搜索对象的类别的搜索结果,其中,所述搜索结果的类别与所述搜索对象的类别相应;分别依据跨类别排序特征和各类别的类别内排序特征,对各类别下的搜索结果进行分排序,得到每个搜索对象的跨类别排序特征值和分类别排序结果;其中,各类别下的搜索结果使用相同的跨类别排序特征;依据每个搜索对象的跨类别排序特征值和分类别排序结果,对所有类别下的搜索结果进行混合排序,得到的混合排序结果中跨类别排序特征值大的搜索对象排在跨类别排序特征值小的搜索对象的前面,以及,每个搜索对象在混合排序结果中的相对位置与该每个搜索对象在分类别排序结果中的相对位置相同;将所述混合排序结果作为搜索结果返回给用户。
【技术特征摘要】
1.一种搜索方法,其特征在于,包括:接收用户的搜索查询请求;依据所述搜索查询请求,得到相应的针对搜索对象的类别的搜索结果,其中,所述搜索结果的类别与所述搜索对象的类别相应;所述搜索对象为商品;分别依据跨类别排序特征和各类别的类别内排序特征,对各类别下的搜索结果进行分排序,得到每个搜索对象的跨类别排序特征值和分类别排序结果;其中,各类别下的搜索结果使用相同的跨类别排序特征;依据每个搜索对象的跨类别排序特征值和分类别排序结果,对所有类别下的搜索结果进行混合排序,得到的混合排序结果中跨类别排序特征值大的搜索对象排在跨类别排序特征值小的搜索对象的前面,以及,每个搜索对象在混合排序结果中的相对位置与该每个搜索对象在分类别排序结果中的相对位置相同;将所述混合排序结果作为搜索结果返回给用户。2.如权利要求1所述的方法,其特征在于,所述依据所述搜索查询请求,得到相应的针对搜索对象的类别的搜索结果的步骤,包括:依据所述搜索查询请求,检索匹配得到相应的针对搜索对象的搜索结果;依据所述搜索对象的类别,将所述搜索结果归类到相应的类别。3.如权利要求1所述的方法,其特征在于,所述依据所述搜索查询请求,检索匹配得到相应的针对搜索对象的类别的搜索结果的步骤,包括:依据所述搜索查询请求,分别针对搜索对象的类别,检索匹配得到相应类别下的搜索结果。4.如权利要求1所述的方法,其特征在于,所述对所有类别下的搜索结果进行混合排序的步骤,包括:在两个或多个搜索对象的跨类别排序特征值相同时,采用固定特征对两个或多个搜索对象的搜索结果进行排序;或者,在两个或多个搜索对象的跨类别排序特征值相同时,采用随机特征对两个或多个搜索对象的搜索结果进行排序。5.如权利要求4所述的方法,其特征在于,所述采用随机特征对两个或多个搜索对象的搜索结果进行排序的步骤,包括:依据与所述搜索结果相应的搜索查询请求,确定随机种子;在两个或多个搜索对象的跨类别排序特征值相同时,依据所述随机种子生成一个伪随机序列,其中,所述伪随机序列的长度等于跨类别排序特征值相同的搜索对象的个数;依据该伪随机序列对所述两个或多个搜索对象进行混合排序。6.如权利要求1所述的方法,其特征在于,所述跨类别排序特征包括文本相关性特征,所述文本相关性特征表示搜索查询请求所涉及的文本与所述搜索对象的描述文本之间的关联程度,其中,所述搜索查...
【专利技术属性】
技术研发人员:姚建强,王平,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。