对象权重确定方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:25757144 阅读:16 留言:0更新日期:2020-09-25 21:06
本公开实施例公开了一种对象权重确定方法、装置、电子设备及可读存储介质,所述对象权重确定方法包括:获取包括预设操作历史结果数据的预设操作历史结果数据集,以及与预设操作历史结果数据相关的历史对象数据;对于预设操作历史结果数据集进行聚合计算,确定预设操作历史结果元素单元的权重值,其中,预设操作历史结果元素单元为在所述预设操作历史结果数据中连续出现的两个或多个预设操作历史结果元素的组合;获取目标对象,并与预设操作历史结果元素单元比较,将与目标对象相应的预设操作历史结果元素单元的权重值确定为目标对象的权重值。该技术方案基于目标对象的权重值的检索能够匹配到合适的商品或者服务,提高了商品或者服务的召回率。

【技术实现步骤摘要】
对象权重确定方法、装置、电子设备及可读存储介质
本公开涉及计算机应用
,具体涉及一种对象权重确定方法、装置、电子设备及可读存储介质。
技术介绍
随着互联网技术的发展,越来越多的商家或者服务提供商通过互联网平台来为用户提供服务。用户通过在搜索引擎中输入查询词(query),得到基于该检索词相关的商品或者服务信息。在整个搜索过程中,根据检索词得到的商品或者服务信息(比如,商品名称、商户名称或者品牌等)与检索词的相关性很大程度依赖于检索词的分词词项(term)的权重。因此,如何确定分词词项的权重显得至关重要。现有技术中,在计算查询词中每个term权重时,通常采用的是词频-逆文件频率(TermFrequency-InverseDocumentfrequency,TF-IDF)的统计方法。TF-IDF在评估分词词项的权重时,一个分词词项在某一特定文本中出现的次数越多,同时在所有文本中出现的次数越少,则给予该分词词项较高的权重值。TF-IDF假设了文本中各个分词词项是独立的,彼此之间没有关联性,而且,对于检索商品或者服务信息的检索词来说,由于该检索词通常是短文本,大多数会出现TF=1的情况,导致基于TF-IDF确定查询词中各分词词项的权重,并检索得到的召回结果与商品或者服务的匹配度不高。
技术实现思路
为了解决相关技术中的问题,本公开实施例提供一种对象权重确定方法、装置、电子设备及可读存储介质。第一方面,本公开实施例中提供了一种对象权重确定方法。具体地,所述对象权重确定方法,包括:获取包括预设操作历史结果数据的预设操作历史结果数据集,以及与所述预设操作历史结果数据相关的历史对象数据,其中,所述预设操作历史结果数据是对于所述历史对象数据执行所述预设操作得到的,所述预设操作历史结果数据中包括一个或多个预设操作历史结果元素,所述历史对象数据中包括一个或多个历史对象元素;对于所述预设操作历史结果数据集进行聚合计算,确定预设操作历史结果元素单元的权重值,其中,所述预设操作历史结果元素单元为在所述预设操作历史结果数据中连续出现的两个或多个预设操作历史结果元素的组合;获取目标对象,并与所述预设操作历史结果元素单元比较,将与所述目标对象相应的预设操作历史结果元素单元的权重值确定为所述目标对象的权重值。结合第一方面,本公开在第一方面的第一种实现方式中,所述获取包括预设操作历史结果数据的预设操作历史结果数据集,以及与所述预设操作历史结果数据相关的历史对象数据之后,还包括:对于所述预设操作历史结果数据和相关历史对象数据进行预处理。结合第一方面的第一种实现方式,本公开在第一方面的第二种实现方式中,所述对于所述预设操作历史结果数据和相关历史对象数据进行预处理,被实施为:对于所述预设操作历史结果数据和/或相关历史对象数据进行预设筛选;对于筛选得到的预设操作历史结果数据和相关历史对象数据进行归一化处理;对于归一化后的预设操作历史结果数据和相关历史对象数据进行分词处理,得到所述预设操作历史结果数据的一个或多个预设操作历史结果元素,以及所述历史对象数据的一个或多个历史对象元素。结合第一方面的第二种实现方式,本公开在第一方面的第三种实现方式中,所述对于归一化后的预设操作历史结果数据和相关历史对象数据进行分词处理,被实施为:对于归一化后的预设操作历史结果数据和相关历史对象数据进行分词处理,若分词结果中存在预设词语或者预设词语中的部分词语,使用所述预设词语替换相应的分词结果。结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式,本公开在第一方面的第四种实现方式中,所述对于所述预设操作历史结果数据集进行聚合计算,确定预设操作历史结果元素单元的权重值,被实施为:根据所述预设操作历史结果数据与所述历史对象数据之间的关联性对于所述预设操作历史结果数据集进行聚合计算,确定预设操作历史结果元素单元的权重值。结合第一方面的第四种实现方式,本公开在第一方面的第五种实现方式中,所述根据所述预设操作历史结果数据与所述历史对象数据之间的关联性对于所述预设操作历史结果数据集进行聚合计算,确定预设操作历史结果元素单元的权重值,被实施为:统计所述预设操作历史结果数据中所述历史对象元素的出现次数,基于所述历史对象元素与所述预设操作历史结果元素之间的对应关系进行聚合计算,得到所述预设操作历史结果元素的出现次数;基于所述预设操作历史结果元素的出现次数,统计得到所述预设操作历史结果元素单元的出现次数,将其作为所述预设操作历史结果元素单元的权重值。结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式、第一方面的第五种实现方式,本公开在第一方面的第六种实现方式中,所述获取目标对象,并与所述预设操作历史结果元素单元比较,将与所述目标对象相应的预设操作历史结果元素单元的权重值确定为所述目标对象的权重值,被实施为:获取目标对象,并与所述预设操作历史结果元素单元比较;当所述预设操作历史结果元素单元中存在与所述目标对象相同的目标预设操作历史结果元素单元时,将所述目标预设操作历史结果元素单元的权重值确定为所述目标对象的权重值;当所述预设操作历史结果元素单元中不存在与所述目标对象相同的预设操作历史结果元素单元时,获取与所述目标对象部分相同的两个或多个目标预设操作历史结果元素单元,对于所述两个或多个目标预设操作历史结果元素单元的权重值进行合并计算,得到所述目标对象的权重值。结合第一方面的第六种实现方式,本公开在第一方面的第七种实现方式中,所述对于所述两个或多个目标预设操作历史结果元素单元的权重值进行合并计算,被实施为:当所述目标预设操作历史结果元素单元覆盖所述目标对象且不存在元素重叠时,对于所述目标预设操作历史结果元素单元的权重值根据在所述目标对象中的出现顺序进行组合;当所述目标预设操作历史结果元素单元覆盖所述目标对象且存在元素重叠时,基于重叠元素权重值的差异对于所述目标预设操作历史结果元素单元的权重值进行归一化计算,对于归一化后的所述目标预设操作历史结果元素单元的权重值根据在所述目标对象中的出现顺序进行去重组合;当所述目标预设操作历史结果元素单元未覆盖所述目标对象且不存在元素重叠时,对于缺失元素的权重值进行填补,对于所述目标预设操作历史结果元素单元及缺失元素的权重值根据在所述目标对象中的出现顺序进行组合;当所述目标预设操作历史结果元素单元未覆盖所述目标对象且存在元素重叠时,基于重叠元素权重值的差异对于存在元素重叠的目标预设操作历史结果元素单元的权重值进行归一化计算,对于缺失元素的权重值进行填补,并对于归一化后的目标预设操作历史结果元素单元及缺失元素的权重值根据在所述目标对象中的出现顺序进行去重组合。结合第一方面、第一方面的第一种实现方式、第一方面的第二种实现方式、第一方面的第三种实现方式、第一方面的第五种实现方式、第本文档来自技高网...

【技术保护点】
1.一种对象权重确定方法,包括:/n获取包括预设操作历史结果数据的预设操作历史结果数据集,以及与所述预设操作历史结果数据相关的历史对象数据,其中,所述预设操作历史结果数据是对于所述历史对象数据执行所述预设操作得到的,所述预设操作历史结果数据中包括一个或多个预设操作历史结果元素,所述历史对象数据中包括一个或多个历史对象元素;/n对于所述预设操作历史结果数据集进行聚合计算,确定预设操作历史结果元素单元的权重值,其中,所述预设操作历史结果元素单元为在所述预设操作历史结果数据中连续出现的两个或多个预设操作历史结果元素的组合;/n获取目标对象,并与所述预设操作历史结果元素单元比较,将与所述目标对象相应的预设操作历史结果元素单元的权重值确定为所述目标对象的权重值。/n

【技术特征摘要】
1.一种对象权重确定方法,包括:
获取包括预设操作历史结果数据的预设操作历史结果数据集,以及与所述预设操作历史结果数据相关的历史对象数据,其中,所述预设操作历史结果数据是对于所述历史对象数据执行所述预设操作得到的,所述预设操作历史结果数据中包括一个或多个预设操作历史结果元素,所述历史对象数据中包括一个或多个历史对象元素;
对于所述预设操作历史结果数据集进行聚合计算,确定预设操作历史结果元素单元的权重值,其中,所述预设操作历史结果元素单元为在所述预设操作历史结果数据中连续出现的两个或多个预设操作历史结果元素的组合;
获取目标对象,并与所述预设操作历史结果元素单元比较,将与所述目标对象相应的预设操作历史结果元素单元的权重值确定为所述目标对象的权重值。


2.根据权利要求1所述的方法,所述获取包括预设操作历史结果数据的预设操作历史结果数据集,以及与所述预设操作历史结果数据相关的历史对象数据之后,还包括:
对于所述预设操作历史结果数据和相关历史对象数据进行预处理。


3.根据权利要求2所述的方法,所述对于所述预设操作历史结果数据和相关历史对象数据进行预处理,被实施为:
对于所述预设操作历史结果数据和/或相关历史对象数据进行预设筛选;
对于筛选得到的预设操作历史结果数据和相关历史对象数据进行归一化处理;
对于归一化后的预设操作历史结果数据和相关历史对象数据进行分词处理,得到所述预设操作历史结果数据的一个或多个预设操作历史结果元素,以及所述历史对象数据的一个或多个历史对象元素。


4.根据权利要求3所述的方法,所述对于归一化后的预设操作历史结果数据和相关历史对象数据进行分词处理,被实施为:
对于归一化后的预设操作历史结果数据和相关历史对象数据进行分词处理,若分词结果中存在预设词语或者预设词语中的部分词语,使用所述预设词语替换相应的分词结果。


5.一种对象权重确定装置,包括:
获取模块,被配置为获取包括预设操作历史结果数据的预设操作历史结果数据集,以及与所述预设操作历史结果数据相...

【专利技术属性】
技术研发人员:刘鑫鑫张卫
申请(专利权)人:拉扎斯网络科技上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1