一种基于大数据的对象搜索方法、装置和计算机设备制造方法及图纸

技术编号:32774912 阅读:12 留言:0更新日期:2022-03-23 19:31
本公开实施例涉及一种基于大数据的对象搜索方法、装置和计算机设备。所述方法包括:获取与搜索词相匹配的多个对象及所述对象的多个维度的名称;按照所述搜索词中第一分词出现的前后顺序,从所述多个维度的名称的第二分词中依次匹配所述第一分词,得到多个分词路径;根据分词路径中的第二分词的维度权重以及所述第二分词与下一个第二分词的关系权重,确定所述多个分词路径中每个分词路径的总权重;将最大的总权重作为所述对象与所述搜索词的相关性,从所述多个对象中确定相关性最大的对象作为目标对象。采用本方法能够综合考虑到搜索词的分词出现在产品的不同位置不同维度的情况,从而提高了搜索的准确性及搜索质量。从而提高了搜索的准确性及搜索质量。从而提高了搜索的准确性及搜索质量。

【技术实现步骤摘要】
一种基于大数据的对象搜索方法、装置和计算机设备


[0001]本公开实施例涉及大数据数据访问
,特别是涉及一种基于大数据的对象搜索方法、装置和计算机设备。

技术介绍

[0002]与通用的网页搜索引擎相比,电子产品搜索具有以下特点:第一,产品标题相对网页标题较短;第二,产品可搜索维度较多,包括产品标题、产品品牌、产品类目、产品属性等;第三,产品数量一般比网页数量少。针对以上特点,通用的网页搜索引擎的搜索方法并不适应于电子产品的搜索。
[0003]现有的电子产品搜索方法主要包括:建立搜索引擎索引库,搜索引擎对用户输入的关键词分词,将分词结果到索引库中进行查找,然后将查找到的包含该分词的多个产品集合做交集,得到搜索产品的集合。然而,现有的搜索流程中,得到的搜索结果的相关性仅考虑索引库中是否包含分词,使得搜索的准确性降低,导致搜索质量不高。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高搜索准确性和搜索质量的搜索方法、装置和计算机设备。
[0005]第一方面,本公开实施例提供了一种基于大数据的对象搜索方法。所述方法包括:
[0006]获取与搜索词相匹配的多个对象及所述对象的多个维度的名称;
[0007]按照所述搜索词中第一分词出现的前后顺序,从所述多个维度的名称的第二分词中依次匹配所述第一分词,得到多个分词路径;
[0008]根据分词路径中的第二分词的维度权重以及所述第二分词与下一个第二分词的关系权重,确定所述多个分词路径中每个分词路径的总权重;
[0009]将最大的总权重作为所述对象与所述搜索词的相关性,从所述多个对象中确定相关性最大的对象作为目标对象。
[0010]在其中一个实施例中,所述获取与搜索词相匹配的多个对象及所述对象的多个维度的名称,包括:
[0011]获取搜索词的多个第一分词;
[0012]获取对象的多个维度的名称,若所述名称中存在多个第二分词与所述多个第一分词相匹配,则所述对象为与所述搜索词相匹配的多个对象之一。
[0013]在其中一个实施例中,所述多个维度的名称包括下述中的至少一种:
[0014]标题名称、类目名称、标识名称。
[0015]在其中一个实施例中,所述根据分词路径中的第二分词的维度权重以及所述第二分词与下一个第二分词的关系权重,确定所述多个分词路径中每个分词路径的总权重,包括:
[0016]获取分词路径中的第二分词的维度权重以及所述第二分词与下一个第二分词的
关系权重,其中,所述维度权重为根据维度的类型设置得到;
[0017]分别确定同一分词路径中的第二分词的维度权重与关系权重的乘积作为所述分词路径的总权重。
[0018]在其中一个实施例中,所述第二分词与下一个第二分词的关系权重的获得方式,包括:
[0019]若所述第二分词的下一个第二分词与所述第二分词位于同一个维度,则所述第二分词与所述下一个第二分词的关系权重被确定为预设的连接权重。
[0020]在其中一个实施例中,所述第二分词与下一个第二分词的关系权重的获得方式,包括:
[0021]若所述第二分词的下一个第二分词与所述第二分词位于不同的维度,则所述第二分词与所述下一个第二分词的关系权重被确定为预设的转移权重。
[0022]在其中一个实施例中,所述将最大的总权重作为所述对象与所述搜索词的相关性,从所述多个对象中确定相关性最大的对象作为目标对象,包括:
[0023]比较所述多个分词路径中每个分词路径的总权重,将最大的总权重作为所述对象与所述搜索词的相关性;
[0024]确定所述多个对象的对应的多个相关性,将所述多个对象中相关性最大的对象作为目标对象。
[0025]第二方面,本公开实施例还提供了一种基于大数据的对象搜索装置。所述装置包括:
[0026]获取模块,用于获取与搜索词相匹配的多个对象及所述对象的多个维度的名称;
[0027]匹配模块,用于按照所述搜索词中第一分词出现的前后顺序,从所述多个维度的名称的第二分词中依次匹配所述第一分词,得到多个分词路径;
[0028]第一确定模块,用于根据分词路径中的第二分词的维度权重以及所述第二分词与下一个第二分词的关系权重,确定所述多个分词路径中每个分词路径的总权重;
[0029]第二确定模块,用于将最大的总权重作为所述对象与所述搜索词的相关性,从所述多个对象中确定相关性最大的对象作为目标对象。
[0030]在其中一个实施例中,所述获取模块,包括:
[0031]第一获取子模块,用于获取搜索词的多个第一分词;
[0032]第二获取子模块,用于获取对象的多个维度的名称,若所述名称中存在多个第二分词与所述多个第一分词相匹配,则所述对象为与所述搜索词相匹配的多个对象之一。
[0033]在其中一个实施例中,所述多个维度的名称包括下述中的至少一种:
[0034]标题名称、类目名称、标识名称。
[0035]在其中一个实施例中,所述第一确定模块,包括:
[0036]获取模块,用于获取分词路径中的第二分词的维度权重以及所述第二分词与下一个第二分词的关系权重,其中,所述维度权重为根据维度的类型设置得到;
[0037]确定模块,用于分别确定同一分词路径中的第二分词的维度权重与关系权重的乘积作为所述分词路径的总权重。
[0038]在其中一个实施例中,所述第二分词与下一个第二分词的关系权重的获得模块,包括:
[0039]确定模块,用于若所述第二分词的下一个第二分词与所述第二分词位于同一个维度,则所述第二分词与所述下一个第二分词的关系权重被确定为预设的连接权重。
[0040]在其中一个实施例中,所述第二分词与下一个第二分词的关系权重的获得模块,包括:
[0041]确定模块,用于若所述第二分词的下一个第二分词与所述第二分词位于不同的维度,则所述第二分词与所述下一个第二分词的关系权重被确定为预设的转移权重。
[0042]在其中一个实施例中,所述第二确定模块,包括:
[0043]比较模块,用于比较所述多个分词路径中每个分词路径的总权重,将最大的总权重作为所述对象与所述搜索词的相关性;
[0044]确定模块,用于确定所述多个对象的对应的多个相关性,将所述多个对象中相关性最大的对象作为目标对象。
[0045]第三方面,本公开实施例还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现本公开实施例中任一项所述的方法的步骤。
[0046]第四方面,本公开实施例还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本公开实施例中任一项所述的方法的步骤。
[0047]第五方面,本公开实施例还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的对象搜索方法,其特征在于,所述方法包括:获取与搜索词相匹配的多个对象及所述对象的多个维度的名称;按照所述搜索词中第一分词出现的前后顺序,从所述多个维度的名称的第二分词中依次匹配所述第一分词,得到多个分词路径;根据分词路径中的第二分词的维度权重以及所述第二分词与下一个第二分词的关系权重,确定所述多个分词路径中每个分词路径的总权重;将最大的总权重作为所述对象与所述搜索词的相关性,从所述多个对象中确定相关性最大的对象作为目标对象。2.根据权利要求1所述的方法,其特征在于,所述获取与搜索词相匹配的多个对象及所述对象的多个维度的名称,包括:获取搜索词的多个第一分词;获取对象的多个维度的名称,若所述名称中存在多个第二分词与所述多个第一分词相匹配,则所述对象为与所述搜索词相匹配的多个对象之一。3.根据权利要求1所述的方法,其特征在于,所述多个维度的名称包括下述中的至少一种:标题名称、类目名称、标识名称。4.根据权利要求1所述的方法,其特征在于,所述根据分词路径中的第二分词的维度权重以及所述第二分词与下一个第二分词的关系权重,确定所述多个分词路径中每个分词路径的总权重,包括:获取分词路径中的第二分词的维度权重以及所述第二分词与下一个第二分词的关系权重,其中,所述维度权重为根据维度的类型设置得到;分别确定同一分词路径中的第二分词的维度权重与关系权重的乘积作为所述分词路径的总权重。5.根据权利要求4所述的方法,其特征在于,所述第二分词与下一个第二分词的关系权重的获得方式,包括:若所述第二分词的下一个第二分词与所述第二分词位于同一个维度,则所述第二分词与所述下一个第二分词的关系权重被确定为预设的连接权重。6.根据权利要求4所述的方法,其特征在于,所述第二分词与下一个第二分词的关系权重的获得方式,包括:若所述第二分词的下一个第二分词与所述第二分词位于不同的维度,则所述第二分词与所述下一个第二分词的关系权重被确定为预设的转移权重。7.根据权利要求1所述的方法,其特征在于,所述将最大的总权重作为所述对象与所述搜索词的相关性,从所述多个对象中确定相关性最大的对象作为目标对象,包括:比较所述多个分词路径中每个分词路径的总权重,将最大的总权重作为所述对象与所述搜索词的相关性;确定所述多个对象的对应的多个相关性,将所述多个对象中相关性最大的对象作为目标对象。8.一种基于大数据的对象搜索装置,其特征在于,所述装置包括:获取模块,用于获取与搜索词相匹配的多个对象及所述对象的多个维度的名称;
匹配模块,用于按照所述搜索词中第一分词出现的前后顺序,从所述多个维...

【专利技术属性】
技术研发人员:马林刘威胡天宝胡蝶颖
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1