一种关联品类词的确定方法、装置及系统制造方法及图纸

技术编号:27414321 阅读:18 留言:0更新日期:2021-02-21 14:30
本发明专利技术公开了一种关联品类词的确定方法、装置及系统。方法包括:获取品类词,将品类词组成品类词组;对比同一品类词组中的品类词,获得品类词对比结果;将品类词对比结果与结构类型条件匹配,将匹配成功的品类词组作为关联词组,并确定关联词组所属的结构类型;将品类词作向量化处理,计算关联词组中品类词之间的空间距离;将关联词组对应的空间距离与其所属结构类型对应的关联条件对比,若空间距离满足所述关联条件,则根据空间距离对应的关联词组确定关联品类词。本发明专利技术根据结构类型条件确定关联词组,通过空间距离、关联条件确定关联词组中品类词是否存在关联关系,实现了关联品类词的自动确定,节省了关联品类词确定的人工成本。本。本。

【技术实现步骤摘要】
一种关联品类词的确定方法、装置及系统


[0001]本专利技术涉及数据挖掘
,特别涉及一种关联品类词对的确定方法、装置及系统。

技术介绍

[0002]在电商场景中,为了满足消费者的购物需求、提高商品销量,运营商往往会根据商品品类的关联关系,确定关联商品,扩大商品的推荐范围。但是由于商品的品类词繁多,品类词的命名方式多样,确定关联品类词难度较大。
[0003]现有技术中,关联品类词的确定,通常使用人工整理、机器模型分类,或者通过消费者行为挖掘等方法。但是上述方法中,人工整理耗费人力且效率不高;机器模型分类方法需要采用大量的已经确定关联关系的品类词样本训练模型,而样本又是通过人工标注的,同样需要耗费人力;利用消费者行为数据挖掘关联品类词对,存在获得的关联品类较局限的问题,从而难以扩大商品推荐范围。

技术实现思路

[0004]为了解决现有技术的问题,本专利技术实施例提供了一种关联品类词的确定方法、装置及系统。所述技术方案如下:
[0005]第一方面,提供了一种关联品类词的确定方法,所述方法包括:
[0006]获取品类词,将所述品类词组成品类词组;
[0007]对比同一所述品类词组中的所述品类词,获得品类词对比结果;
[0008]将所述品类词对比结果与结构类型条件匹配,将匹配成功的所述品类词组作为关联词组,并确定所述关联词组所属的结构类型;
[0009]将所述品类词作向量化处理,计算所述关联词组中所述品类词之间的空间距离;
[0010]将所述关联词组对应的空间距离与其所属结构类型对应的关联条件对比,若所述空间距离满足所述关联条件,则根据所述空间距离对应的所述关联词组确定关联品类词。
[0011]进一步地,所述对比同一所述品类词组中的所述品类词,获得品类词对比结果,包括:
[0012]按照预设顺序,对比同一所述品类词组中所述品类词对应位置上的字符,获得所述品类词对比结果。
[0013]进一步地,所述关联条件的确定包括:
[0014]统计属于相同所述结构类型的所述关联词组对应的空间距离;
[0015]确定包含所述关联词组数量最多的空间距离范围为准关联条件;
[0016]根据该所述结构类型的权值和所述准关联条件确定该所述结构类型对应的所述关联条件。
[0017]进一步地,所述若所述空间距离满足所述关联条件,则根据所述空间距离对应的所述关联词组确定关联品类词,包括:
[0018]判断所述关联词组是否为上下位词组或者同义词组,若是,则删除所述关联词组,若否,则判断所述品类词的在相应的位置中是否包含预设的特殊字符,若是,则删除所述关联词组,若否,则确定所述关联词组中的所述品类词关联。
[0019]进一步地,所述判断所述关联词组是否为上下位词组,包括:
[0020]将所述关联词组与上下位词组集合匹配,若匹配成功,则确定所述关联词组为所述上下位词组。
[0021]进一步地,所述判断所述关联词组是否为同义词组,包括:
[0022]判断同一所述关联词组的所述品类词之间不一致的字符中是否包含同义词字符,若是,则确定所述关联词组为所述同义词组。
[0023]第二方面,提供了一种关联品类词的确定装置,所述装置包括:
[0024]词组生成模块,用于获取品类词,将所述品类词组成品类词组;
[0025]品类词对比模块,用于对比同一所述品类词组中的所述品类词,获得品类词对比结果;
[0026]分类模块,用于将所述品类词对比结果与结构类型条件匹配,将匹配成功的所述品类词作为关联词组,并确定所述关联词组所属的结构类型;
[0027]空间距离计算模块,用于将所述品类词进行向量化处理,计算所述关联词组中所述品类词之间的空间距离;
[0028]关联模块,用于所述关联词组对应的空间距离与其所属结构类型对应的关联条件对比,若所述空间距离满足所述关联条件,则根据所述空间距离对应的所述关联词组确定关联品类词。
[0029]进一步地,所述品类词对比模块,具体用于按照预设顺序,对比同一所述品类词组中所述品类词对应位置上的字符,获得所述品类词对比结果。
[0030]进一步地,所述装置还包括:
[0031]关联条件确定模块,用于统计属于相同所述结构类型的所述关联词组对应的空间距离;
[0032]确定包含所述关联词组数量最多的空间距离范围为准关联条件;
[0033]根据该所述结构类型的权值和所述准关联条件确定该所述结构类型对应的所述关联条件。
[0034]进一步地,所述装置还包括:
[0035]筛选模块,用于判断所述关联词组是否为上下位词组或者同义词组,若是,则删除所述关联词组,若否,则判断所述品类词的在相应的位置中是否包含预设的特殊字符,若是,则删除所述关联词组,若否,则确定所述关联词组中的所述品类词关联。
[0036]进一步地,所述筛选模块,包括:
[0037]上下为词组判断模块,用于将关联词组与上下位词组集合匹配,若匹配成功,则确定关联词组为上下位词组。
[0038]进一步地,所述筛选模块,包括:
[0039]同义词组判断模块,用于判断同一关联词组的品类词之间不一致的字符中是否包含同义词字符,若是,则确定关联词组为同义词组。
[0040]第三方面,提供了一种计算机系统,所述系统包括:
[0041]一个或多个处理器;以及
[0042]与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行上述第一方面任一项所述的方法。
[0043]本专利技术实施例提供的技术方案带来的有益效果是:
[0044]1、本专利技术通过根据结构类型条件确定关联词组,通过空间距离、关联条件确定关联词组中的品类词是否存在关联关系,实现了关联品类词的自动确定,无需人工参与,节省了关联品类词确定的人工成本;
[0045]2、本专利技术中不同的结构类型对应不同的关联条件,避免了品类词由于在字符上关联性较小而被忽略关联性的情况,全面地挖掘品类词之间的关联关系;
[0046]3、本专利技术中还排除了上下位词组、同义词组以及各种无效字符相同而造成品类词关联关系被错误认定的情况,提高了关联品类词挖掘的准确性。
附图说明
[0047]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0048]图1是本专利技术实施例提供的关联品类词的确定方法流程图;
[0049]图2是本专利技术实施例提供的关联品类词的确定装置结构示意图;
[0050]图3是本专利技术实施例提供的计算机系统结构示意图。
具体实施方式
[0051]为使本专利技术的目的、技术方案本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种关联品类词的确定方法,其特征在于,包括:获取品类词,将所述品类词组成品类词组;对比同一所述品类词组中的所述品类词,获得品类词对比结果;将所述品类词对比结果与结构类型条件匹配,将匹配成功的所述品类词组作为关联词组,并确定所述关联词组所属的结构类型;将所述品类词作向量化处理,计算所述关联词组中所述品类词之间的空间距离;将所述关联词组对应的空间距离与其所属结构类型对应的关联条件对比,若所述空间距离满足所述关联条件,则根据所述空间距离对应的所述关联词组确定关联品类词。2.如权利要求1所述的方法,其特征在于,所述对比同一所述品类词组中的所述品类词,获得品类词对比结果,包括:按照预设顺序,对比同一所述品类词组中所述品类词对应位置上的字符,获得所述品类词对比结果。3.如权利要求1所述的方法,其特征在于,所述关联条件的确定包括:统计属于相同所述结构类型的所述关联词组对应的空间距离;确定包含所述关联词组数量最多的空间距离范围为准关联条件;根据该所述结构类型的权值和所述准关联条件确定该所述结构类型对应的所述关联条件。4.如权利要求1~3任意一项所述的方法,其特征在于,所述若所述空间距离满足所述关联条件,则根据所述空间距离对应的所述关联词组确定关联品类词,包括:判断所述关联词组是否为上下位词组或者同义词组,若是,则删除所述关联词组,若否,则判断所述品类词的在相应的位置中是否包含预设的特殊字符,若是,则删除所述关联词组,若否,则确定所述关联词组中的所述品类词关联。5.如权利要求4所述的方法,其特征在于,所述判断所述关联词组是否为上下位词组,包括:将所述关联词组与上下位词组集合匹配,若匹配成功,则确定所述关联词组为所述...

【专利技术属性】
技术研发人员:张森沈艺齐康许加书梁诗雯
申请(专利权)人:苏宁云计算有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1