物品类别的确定方法和装置制造方法及图纸

技术编号:27977401 阅读:21 留言:0更新日期:2021-04-06 14:12
本发明专利技术提出一种物品类别的确定方法和装置,其中,方法包括:根据预设的决策树中的根节点,在预设的多个样本物品信息中确定属于同一个根节点的第一物品信息;获取第一物品信息的多个第一物品分词和每个第一物品分词的第一级别信息;根据第一级别信息确定属于同一个根节点的枝节点的多个第二物品分词;根据预设算法计算每个第二物品分词的置信度,根据置信度在多个第二物品分词中确定第一目标物品分词;根据第一目标物品分词在决策树中增加同一个根节点的枝节点,以便于根据更新后的决策树识别物品类别。由此,融合自然语言处理算法和其他平台的物品信息分配体系来形成决策树,实现了物品分类的标准化,提高了物品分类的准确性和效率。

【技术实现步骤摘要】
物品类别的确定方法和装置
本专利技术涉及自然语言处理
,尤其涉及一种物品类别的确定方法和装置。
技术介绍
通常,对物品等品名的分类算法是基于自然语言处理技术实现的。分类一直是数据科学界研究的重点问题,可以广泛地应用到日常生活中。伴随着电子商务行业的快速发展。物品的数量越来越多,需要对物品制定分类,便于物品供应方(卖家)和物品需求方(买家)快速找到所需的物品。相关技术中,针对现在每天都会产生的大量物品名称,人工去为物品分类,不仅工作量巨大,速度慢,而且也会出现分类错误的情况。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种物品类别的确定方法,以实现物品分类的标准化,提高了物品分类的准确性和效率。本专利技术的第二个目的在于提出一种物品类别的确定装置。本专利技术的第三个目的在于提出一种计算机设备。本专利技术的第四个目的在于提出一种非临时性计算机可读存储介质。为达上述目的,本专利技术第一方面实施例提出了一种物品类别的确定方法,包括:根据预设的决策树中的根节点,在预设的多个样本物品信息中确定属于同一个根节点的第一物品信息;获取所述第一物品信息的多个第一物品分词和每个所述第一物品分词的第一级别信息;根据所述第一级别信息确定属于所述同一个根节点的枝节点的多个第二物品分词;根据预设算法计算每个所述第二物品分词的置信度,根据所述置信度在所述多个第二物品分词中确定第一目标物品分词;根据所述第一目标物品分词在所述决策树中增加所述同一个根节点的枝节点,以便于根据更新后的所述决策树识别物品类别。为达上述目的,本专利技术第二方面实施例提出了一种物品类别的确定装置,包括:第一确定模块,用于根据预设的决策树中的根节点,在预设的多个样本物品信息中确定属于同一个根节点的第一物品信息;获取模块,用于获取所述第一物品信息的多个第一物品分词和每个所述第一物品分词的第一级别信息;第二确定模块,用于根据所述第一级别信息确定属于所述同一个根节点的枝节点的多个第二物品分词;第三确定模块,用于根据预设算法计算每个所述第二物品分词的置信度,根据所述置信度在所述多个第二物品分词中确定第一目标物品分词;更新模块,用于根据所述第一目标物品分词在所述决策树中增加所述同一个根节点的枝节点,以便于根据更新后的所述决策树识别物品类别。为达上述目的,本专利技术第三方面实施例提出了一种计算机设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器执行所述计算机程序时,实现如第一方面实施例所述的物品类别的确定方法。为了实现上述目的,本专利技术第四方面实施例提出了一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器被执行时实现如第一方面实施例所述的物品类别的确定方法。本专利技术实施例,至少具备如下有益技术效果:融合自然语言处理算法和其他平台的物品信息分配体系来形成决策树,实现了物品分类的标准化,提高了物品分类的准确性和效率。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本专利技术实施例所提供的一种物品类别的确定方法的流程示意图;图2为本专利技术实施例所提供的一种决策树的结构示意图;图3为本专利技术实施例所提供的另一种物品类别的确定方法的流程示意图;图4为本专利技术实施例所提供的又一种物品类别的确定方法的流程示意图;图5为本专利技术实施例所提供的还一种物品类别的确定方法的流程示意图;图6为本专利技术实施例所提供的一种物品类别的确定场景示意图;图7为本专利技术实施例提供的一种物品类别的确定装置的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。下面参考附图描述本专利技术实施例的物品类别的确定方法和装置。针对现有技术中,缺少物品分类需要人工处理的技术问题,本专利技术提出了一种可以对物品类别进行自动分类的方法,该对物品分类的方式不但可以应用在对线上物品的分类,还可以当下应用广泛的物品的管控中,可直接根据物品的物品名称等直接分类,避免投放物品的有关人员人工填写物品分类导致的难以发现不合有关规定的物品被投放等。具体而言,图1为本专利技术实施例所提供的一种物品类别的确定方法的流程示意图。如图1所示,该物品类别的确定方法包括以下步骤:步骤101,根据预设的决策树中的根节点,在预设的多个样本物品信息中确定属于同一个根节点的第一物品信息。其中,预设的决策树可以是有关技术人员预先设置的至少包含根节点的树状图,其中,每个根节点对应于第一级的物品分类,举例而言,如图2所示,该预设的决策树包含根节点“根节点1”、“根节点2”、“根节点3”等。另外,样本物品信息可以是从线上购物平台中获取的,该样本物品信息本身为了适应于线上购物平台的检索需求,具有与该线上购物平台适配的级别分类信息,比如,对于某购物平台上的物品信息“男装男裤工装裤”则明显可以得到其对应的级别信息。本实施例中,在购物平台上本身分类体系的基础上,进一步总结扩展,满足了电子商务爆炸式的增长带来的物品信息多样化后的发展需求,以京东的物品分类体系为例,每件物品包含三个级别的类别,其中一级类别为,每个一级类别下有多个二级类别,每个二级类别下再区分多个三级类别。其中一级类别有十几个,二级类别有一百多个,三级类别达到一千多个。而实际物品等的种类远超电商售卖的物品种类,因此,本专利技术实施例提供了一个覆盖率更高的分类体系,也即是本专利技术实施例中的决策树。因此,本实施例中,在预设的多个物品信息中确定属于同一个根节点的第一物品信息,其中,该第一物品信息为多个,由于第一物品信息本身包含了对应的级别信息,因此,可以基于第一物品信息进一步丰富对应根节点的枝节点。需要说明的是,在不同的应用场景中,在预设的多个样本物品信息中确定属于同一个根节点的第一物品信息的方式不同,示例如下:示例一:在本示例中,根据语义信息来对第一物品信息进行所属根节点的确定。在本实施例中,如图3所示,在预设的多个样本物品信息中确定属于同一个根节点的第一物品信息,包括:步骤301,识别每个样本物品信息的第一语义信息。可以理解的是,每个样本物品信息的语义必然和其所属的根节点的语义相关度更高,因此,识别每个样本物品信息的第一语义信息,其中,可以预先构建深度学习模型,基于该深度模型得到每个样本物品信息的第一语义信息。步骤302,计算根节点的第二语义信息。第二语义信息的计算方式可以参照第一语义信息的计算方式,在此不再赘述。步骤303,计算第一本文档来自技高网...

【技术保护点】
1.一种物品类别的确定方法,其特征在于,包括以下步骤:/n根据预设的决策树中的根节点,在预设的多个样本物品信息中确定属于同一个根节点的第一物品信息;/n获取所述第一物品信息的多个第一物品分词和每个所述第一物品分词的第一级别信息;/n根据所述第一级别信息确定属于所述同一个根节点的枝节点的多个第二物品分词;/n根据预设算法计算每个所述第二物品分词的置信度,根据所述置信度在所述多个第二物品分词中确定第一目标物品分词;/n根据所述第一目标物品分词在所述决策树中增加所述同一个根节点的枝节点,以便于根据更新后的所述决策树识别物品类别。/n

【技术特征摘要】
1.一种物品类别的确定方法,其特征在于,包括以下步骤:
根据预设的决策树中的根节点,在预设的多个样本物品信息中确定属于同一个根节点的第一物品信息;
获取所述第一物品信息的多个第一物品分词和每个所述第一物品分词的第一级别信息;
根据所述第一级别信息确定属于所述同一个根节点的枝节点的多个第二物品分词;
根据预设算法计算每个所述第二物品分词的置信度,根据所述置信度在所述多个第二物品分词中确定第一目标物品分词;
根据所述第一目标物品分词在所述决策树中增加所述同一个根节点的枝节点,以便于根据更新后的所述决策树识别物品类别。


2.如权利要求1所述的方法,其特征在于,所述在预设的多个样本物品信息中确定属于同一个根节点的第一物品信息,包括:
识别每个所述样本物品信息的第一语义信息;
计算所述根节点的第二语义信息;
计算所述第一语义信息和所述第二语义信息的相似度,确定所述相似度大于预设阈值的样本物品信息为所述第一物品信息。


3.如权利要求1所述的方法,其特征在于,所述获取所述第一物品信息的多个第一物品分词和每个所述第一物品分词的第一级别信息,包括:
对所述第一目标物品切词处理,生成所述多个第一物品分词;
查询预设对应关系,确定与每个所述第一物品分词对应的第一级别信息。


4.如权利要求1所述的方法,其特征在于,所述根据所述第一级别信息确定属于所述同一个根节点的枝节点的多个第二物品分词,包括:
在所述第一级别信息中确定与所述枝节点对应的枝级别信息;
确定与所述枝级别信息对应的所述多个第二物品分词。


5.如权利要求1所述的方法,其特征在于,所述根据预设算法计算每个所述第二物品分词的置信度,根据所述置信度在所述多个第二物品分词中确定第一目标物品分词,包括:
计算每个所述第二物品分词在所属的第一物品信息中出现的第一频次;
计算每个所述第二物品分词在所有的所述第二物品分词中出现的第二频次;
根据所述第一频次和所述第二频次确定每个所述第二物品分词的置信度;
确定所述置信度大于预设置信度阈值的第二物品分词为所述第一目标物品分词。


6...

【专利技术属性】
技术研发人员:张凯林敏敏
申请(专利权)人:绿湾网络科技有限公司
类型:发明
国别省市:北京;11

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1