【技术实现步骤摘要】
一种基于大数据的对象搜索方法、装置和计算机设备
[0001]本公开实施例涉及大数据数据访问
,特别是涉及一种基于大数据的对象搜索方法、装置和计算机设备。
技术介绍
[0002]与通用的网页搜索引擎相比,电子产品搜索具有以下特点:第一,产品标题相对网页标题较短;第二,产品可搜索维度较多,包括产品标题、产品品牌、产品类目、产品属性等;第三,产品数量一般比网页数量少。针对以上特点,通用的网页搜索引擎的搜索方法并不适应于电子产品的搜索。
[0003]现有的电子产品搜索方法主要包括:建立搜索引擎索引库,搜索引擎对用户输入的关键词分词,将分词结果到索引库中进行查找,然后将查找到的包含该分词的多个产品集合做交集,得到搜索产品的集合。然而,现有的搜索流程中,得到的搜索结果的相关性仅考虑索引库中是否包含分词,使得搜索的准确性降低,导致搜索质量不高。
技术实现思路
[0004]基于此,有必要针对上述技术问题,提供一种能够提高搜索准确性和搜索质量的搜索方法、装置和计算机设备。
[0005]第一方面,本公开实施 ...
【技术保护点】
【技术特征摘要】
1.一种基于大数据的对象搜索方法,其特征在于,所述方法包括:获取与搜索词相匹配的多个对象及所述对象的多个维度的名称;按照所述搜索词中第一分词出现的前后顺序,从所述多个维度的名称的第二分词中依次匹配所述第一分词,得到多个分词路径;根据分词路径中的第二分词的维度权重以及所述第二分词与下一个第二分词的关系权重,确定所述多个分词路径中每个分词路径的总权重;将最大的总权重作为所述对象与所述搜索词的相关性,从所述多个对象中确定相关性最大的对象作为目标对象。2.根据权利要求1所述的方法,其特征在于,所述获取与搜索词相匹配的多个对象及所述对象的多个维度的名称,包括:获取搜索词的多个第一分词;获取对象的多个维度的名称,若所述名称中存在多个第二分词与所述多个第一分词相匹配,则所述对象为与所述搜索词相匹配的多个对象之一。3.根据权利要求1所述的方法,其特征在于,所述多个维度的名称包括下述中的至少一种:标题名称、类目名称、标识名称。4.根据权利要求1所述的方法,其特征在于,所述根据分词路径中的第二分词的维度权重以及所述第二分词与下一个第二分词的关系权重,确定所述多个分词路径中每个分词路径的总权重,包括:获取分词路径中的第二分词的维度权重以及所述第二分词与下一个第二分词的关系权重,其中,所述维度权重为根据维度的类型设置得到;分别确定同一分词路径中的第二分词的维度权重与关系权重的乘积作为所述分词路径的总权重。5.根据权利要求4所述的方法,其特征在于,所述第二分词与下一个第二分词的关系权重的获得方式,包括:若所述第二分词的下一个第二分词与所述第二分词位于同一个维度,则所述第二分词与所述下一个第二分词的关系权重被确定为预设的连接权重。6.根据权利要求4所述的方法,其特征在于,所述第二分词与下一个第二分词的关系权重的获得方式,包括:若所述第二分词的下一个第二分词与所述第二分词位于不同的维度,则所述第二分词与所述下一个第二分词的关系权重被确定为预设的转移权重。7.根据权利要求1所述的方法,其特征在于,所述将最大的总权重作为所述对象与所述搜索词的相关性,从所述多个对象中确定相关性最大的对象作为目标对象,包括:比较所述多个分词路径中每个分词路径的总权重,将最大的总权重作为所述对象与所述搜索词的相关性;确定所述多个对象的对应的多个相关性,将所述多个对象中相关性最大的对象作为目标对象。8.一种基于大数据的对象搜索装置,其特征在于,所述装置包括:获取模块,用于获取与搜索词相匹配的多个对象及所述对象的多个维度的名称;
匹配模块,用于按照所述搜索词中第一分词出现的前后顺序,从所述多个维...
【专利技术属性】
技术研发人员:马林,刘威,胡天宝,胡蝶颖,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。