一种店铺类目识别模型生成、店铺类目识别的方法及装置制造方法及图纸

技术编号:28478283 阅读:16 留言:0更新日期:2021-05-15 21:47
本申请公开了一种店铺类目识别模型生成、店铺类目识别的方法及装置,其中,所述店铺类目识别模型生成方法包括:获取样本店铺的样本商品信息和样本商品信息对应的多级业务类目;确定店铺类目识别的多个识别维度、每个识别维度对应的至少一个分支节点和每个识别维度对应的类目识别约束信息;基于样本商品信息和样本商品信息对应的多级业务类目,生成样本店铺在每个识别维度下的目标识别信息;基于每个识别维度的影响因子和对应的至少一个分支节点,构建店铺类目识别对应的预设树结构;基于目标识别信息和类目识别约束信息对预设树结构进行店铺类目识别训练,得到店铺类目识别模型。本申请能够提高店铺类目识别的准确度,减少人工操作失误风险。工操作失误风险。工操作失误风险。

【技术实现步骤摘要】
一种店铺类目识别模型生成、店铺类目识别的方法及装置


[0001]本申请涉及数据处理领域,具体涉及一种店铺类目识别模型生成、店铺类目识别的方法及装置。

技术介绍

[0002]传统的店铺类目识别方法通过人工手段对店铺类目进行标注,依赖于业务人员手动点击店铺链接,根据店铺下的商品数量和商品类目主观对店铺类目进行定义。
[0003]对于传统的人工标注店铺类目方法而言,由于店铺下大量的在售商品数据和复杂繁多的商品层级分类体系,手动点击店铺链接不仅需要投入大量人力,导致低效率的类目标注,而且由于人工的主观性,易产生错误的标注结果。基于人工标注店铺类目方法表现出的低效率和高风险,需要提供更加高效科学的技术方案。

技术实现思路

[0004]本申请提供了一种店铺类目识别模型生成、店铺类目识别的方法及装置,可以实现快速地店铺类目识别,提高店铺类目识别的效率和准确度,进而减少人工参与及操作失误风险,本申请技术方案如下:一方面,提供了一种店铺类目识别模型的生成方法,所述方法包括:获取样本店铺的样本商品信息和所述样本商品信息对应的多级业务类目;确定店铺类目识别的多个识别维度、每个识别维度对应的至少一个分支节点和所述每个识别维度对应的类目识别约束信息;基于所述样本商品信息和所述样本商品信息对应的多级业务类目,生成所述样本店铺在所述每个识别维度下的目标识别信息;基于所述每个识别维度的影响因子和对应的至少一个分支节点,构建店铺类目识别对应的预设树结构,所述影响因子表征所述每个识别维度在店铺类目识别中的权重;基于所述目标识别信息和所述类目识别约束信息对所述预设树结构进行店铺类目识别训练,得到所述店铺类目识别模型。
[0005]另一方面,提供了一种店铺类目识别方法,所述方法包括:获取待识别店铺的商品信息;将所述商品信息输入商品类目预测模型进行商品类目预测,得到所述商品信息对应的多级标准类目;基于店铺类目识别模型对所述商品信息对应的多级标准类目进行店铺类目识别,得到所述待识别店铺的类目信息;其中,所述店铺类目识别模型根据上述店铺类目识别模型的生成方法生成后得到。
[0006]另一方面,提供了一种店铺类目识别模型的生成装置,所述装置包括:样本商品信息获取模块,用于获取样本店铺的样本商品信息和所述样本商品信息
对应的多级业务类目;识别维度确定模块,用于确定店铺类目识别的多个识别维度、每个识别维度对应的至少一个分支节点和所述每个识别维度对应的类目识别约束信息;目标识别信息生成模块,用于基于所述样本商品信息和所述样本商品信息对应的多级业务类目,生成所述样本店铺在所述每个识别维度下的目标识别信息;树结构构建模块,用于基于所述每个识别维度的影响因子和对应的至少一个分支节点,构建店铺类目识别对应的预设树结构,所述影响因子表征所述每个识别维度在店铺类目识别中的权重;店铺类目识别训练模块,用于基于所述目标识别信息和所述类目识别约束信息对所述预设树结构进行店铺类目识别训练,得到所述店铺类目识别模型另一方面,提供了一种店铺类目识别装置,所述装置包括:商品信息获取模块,用于获取待识别店铺的商品信息;商品类目预测模块,用于将所述商品信息输入商品类目预测模型进行商品类目预测,得到所述商品信息对应的多级标准类目;店铺类目识别模块,用于基于店铺类目识别模型对所述商品信息对应的多级标准类目进行店铺类目识别,得到所述待识别店铺的类目信息;其中,所述店铺类目识别模型根据上述店铺类目识别模型的生成装置生成后得到。
[0007]另一方面,提供了一种店铺类目识别设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如上述的店铺类目识别方法。
[0008]另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如上述的店铺类目识别方法。
[0009]本申请提供的一种店铺类目识别模型生成、店铺类目识别的方法及装置,具有如下技术效果:本申请能够得到具有高泛化能力的店铺类目识别模型,在利用商品类目预测模型和店铺类目识别模型得到待识别店铺的类目识别时,不仅能够高效地处理大数据量,快速识别店铺的类目信息,而且提高了店铺类目识别准确度,从而大大减少人工参与及降低相应的操作失误风险。
附图说明
[0010]为了更清楚地说明本申请实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
[0011]图1是本申请实施例提供的一种店铺类目识别模型的生成方法的流程示意图;图2是本申请实施例提供的一种样本店铺的目标识别信息生成方法的流程示意图;
图3是本申请实施例提供的一种预设树结构的构建方法的流程示意图;图4是本申请实施例提供的一种预设树结构的示意图;图5是本申请实施例提供的一种店铺类目识别训练方法的流程示意图;图6是本申请实施例提供的一种目标分支路径的示意图;图7是本申请实施例提供的一种店铺类目识别方法的流程示意图;图8是本申请实施例提供的一种商品类目预测模型的训练方法的流程示意图;图9是本申请实施例提供的一种类目映射字典的构建方法的流程示意图;图10是本申请实施例提供的一种待识别店铺的类目信息的识别方法的流程示意图;图11是本申请实施例提供的一种待识别店铺的确定方法的流程示意图;图12是本申请实施例提供的一种店铺类目识别模型的生成示意图;图13是本申请实施例提供的一种店铺类目识别装置示意图;图14是本申请实施例提供的一种店铺类目识别方法的服务器的硬件结构框图。
具体实施方式
[0012]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0013]需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0014]以下介绍本申请实施例提供的一种店铺类目识别模型的生成方法,图1为本申请实施例提供的一种店铺类目识别模型的生成方法的流程示意图。需要说明的是,本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种店铺类目识别模型的生成方法,其特征在于,所述方法包括:获取样本店铺的样本商品信息和所述样本商品信息对应的多级业务类目;确定店铺类目识别的多个识别维度、每个识别维度对应的至少一个分支节点和所述每个识别维度对应的类目识别约束信息;基于所述样本商品信息和所述样本商品信息对应的多级业务类目,生成所述样本店铺在所述每个识别维度下的目标识别信息;基于所述每个识别维度的影响因子和对应的至少一个分支节点,构建店铺类目识别对应的预设树结构,所述影响因子表征所述每个识别维度在店铺类目识别中的权重;基于所述目标识别信息和所述类目识别约束信息对所述预设树结构进行店铺类目识别训练,得到所述店铺类目识别模型。2.根据权利要求1所述的方法,其特征在于,所述样本商品信息包括多个样本商品的商品信息,所述基于所述样本商品信息和所述样本商品信息对应的多级业务类目,生成所述样本店铺在所述每个识别维度下的目标识别信息包括:根据每个样本商品的商品信息和对应的多级业务类目确定所述每个样本商品在所述多个识别维度下对应的识别信息;针对每个识别维度,将所述多个样本商品对应的识别信息满足预设维度条件的样本商品的商品信息和对应的多级业务类目作为所述样本店铺在所述每个识别维度下的目标识别信息。3.根据权利要求1所述的方法,其特征在于,所述基于所述每个识别维度的影响因子和对应的至少一个分支节点,构建店铺类目识别对应的预设树结构包括:基于所述影响因子,确定所述每个识别维度的层级信息;根据所述层级信息和所述每个识别维度对应的至少一个分支节点,生成所述预设树结构。4.根据权利要求1至3任一所述的方法,其特征在于,所述基于所述目标识别信息和所述类目识别约束信息对所述预设树结构进行店铺类目识别训练,得到所述店铺类目识别模型包括:根据所述目标识别信息,确定所述预设树结构中与所述目标识别信息匹配的目标分支节点,所述目标分支节点为识别维度区间中包含所述目标识别信息的分支节点;将所述预设树结构中包括所述目标分支节点的分支路径,作为目标分支路径;遍历所述目标分支路径中每一目标分支节点,在遍历到所述每一目标分支节点时,判断当前遍历到的分支节点对应识别维度的目标识别信息是否满足对应的类目识别约束信息;若满足,停止遍历,并从当前遍历到的分支节点对应识别维度下的目标识别信息包含的多级业务类目中确定所述样本店铺的类目信息;对所述类目信息进行验证分析,得到验证分析结果;基于所述验证分析结果,对所述每个识别维度的影响因子和对应的至少一个分支节点进行调整,更新所述预设树结构,基于更新后的预设树结构重复所述根据所述目标识别信息,确定所述预设树结构中与所述目标识别信息匹配的目标分支节点至所述对所述类目信息进行验证分析,得到验证分析结果的步骤,直至所述验证分析结果满足预设验证条件;
将所述验证分析结果满足预设验证条件时的预设树结构作为所述店铺类目识别模型。5.一种店铺类目识别方法,其特征在于,所述方法包括:获取待识别店铺的商品信息;将所述商品信息输入商品类目预测模型进行商品类目预测,得到所述商品信息对应的多级标准类目;基于店铺类目识别模型对所述商品信息对应的多级标准类目进行店铺类目识别,得到所述待识别店铺的类目信息;其中,所述店铺类目识别模型根据权利要求1至4任一所述生成方法生成后得到。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:获取标准类目数据和样本店铺的样本商品信息,所述标准类目数据包括多个标准类目;基于所述多个标准类目,确定所述样本商品信息对应的多级...

【专利技术属性】
技术研发人员:陈鑫亚侯兴翠王化楠
申请(专利权)人:连连杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1