基于层级分类模型的信息分类方法及装置制造方法及图纸

技术编号:35345109 阅读:13 留言:0更新日期:2022-10-26 12:10
本发明专利技术公开了一种基于层级分类模型的信息分类方法及装置,该方法包括:获取需要进行分类的待处理文本信息,将待处理文本信息输入至预先设定的层级分类模型,得到待处理文本信息的层级分类结果,层级分类结果包括层级集合中每个层级的分类结果,层级集合包括至少两个层级,不同层级对应不同的层级标识且不同层级对应不同的分类结果范围,根据层级分类结果确定待处理文本信息对应的层级类别标签。可见,实施本发明专利技术能够通过层级分类模型对信息进行层级分类,能够有利于提高信息层级分类的效率,以及能够有利于提高信息层级分类的准确性。性。性。

【技术实现步骤摘要】
基于层级分类模型的信息分类方法及装置


[0001]本专利技术涉及信息处理
,尤其涉及一种基于层级分类模型的信息分类方法及装置。

技术介绍

[0002]在实际生活中,随着互联网在全球的飞速发展,人们面临的信息的数量也呈指数型增长,从而对于信息处理的数量也在随之改变。
[0003]目前,对于各大短视频、电商平台的用户来说,导航菜单起到了重要的作用,导航菜单主要用于帮助用户在复杂的页面中寻找到所需要的资料和素材,以广告素材为例,为了方便查找,通常导航菜单存在多层关系,这样能够更清晰地对素材进行分类。但是,目前对于信息进行层级分类通常是针对首层的父级类别训练模型进行训练,然后每个父级类别均训练一个模型用于对该父级类别下的子类别进行区分,以得到层级分类结果。这种方法不仅会导致模型的数量较多,还会导致每个父级类别下存在的多个子类别之间的界限模糊不清,进而导致层级分类结果中类别分类的准确性低下。可见,如何提高信息分类的准确性显得尤为重要。

技术实现思路

[0004]本专利技术所要解决的技术问题在于,提供一种基于层级分类模型的信息分类方法及装置,能够通过层级分类模型对信息进行分类,能够有利于提高信息分类的效率,以及能够有利于提高信息分类的准确性。
[0005]为了解决上述技术问题,本专利技术第一方面公开了一种基于层级分类模型的信息分类方法,所述方法包括:
[0006]获取需要进行分类的待处理文本信息;
[0007]将所述待处理文本信息输入至预先设定的层级分类模型,得到所述待处理文本信息的层级分类结果,所述层级分类结果包括层级集合中每个层级的分类结果,所述层级集合包括至少两个层级,不同层级对应不同的层级标识且不同层级对应不同的分类结果范围;
[0008]根据所述层级分类结果确定所述待处理文本信息对应的层级类别标签。
[0009]作为一种可选的实施方式,在本专利技术第一方面中,每个所述层级的分类结果包括每个所述层级对应的类别标签;
[0010]其中,所述根据所述层级分类结果确定所述待处理文本信息对应的层级类别标签,包括:
[0011]根据所述层级分类结果中所有所述层级对应的类别标签,分析每任意两个所述层级对应的类别标签是否存在关联关系,得到分析结果;
[0012]当所述分析结果表示所有所述层级中每任意两个所述层级对应的类别标签均存在所述关联关系时,将所有所述层级对应的类别标签确定为所述待处理文本信息对应的层
级类别标签;
[0013]当所述分析结果表示所有所述层级中每任意两个所述层级对应的类别标签不均存在所述关联关系时,从所有所述层级中筛选出所有独立层级,根据每个所述独立层级对应的层级标识、每个剩余层级对应的层级标识以及每个所述剩余层级对应的类别标签,确定所述待处理文本信息对应的层级类别标签;
[0014]其中,每个所述独立层级对应的类别标签与所有所述层级中除该独立层级之外的其它任一层级对应的类别标签均不存在所述关联关系;所有所述剩余层级是所有所述层级中除所有所述独立层级之外的层级。
[0015]作为一种可选的实施方式,在本专利技术第一方面中,所述根据所述层级分类结果确定所述待处理文本信息对应的层级类别标签,还包括:
[0016]当所述分析结果表示所有所述层级中每任意两个所述层级对应的类别标签均不存在所述关联关系时,确定每个所述层级对应的类别标签的置信度;
[0017]从所有所述置信度中筛选出最高置信度,判断所述最高置信度是否满足预先设定的置信度条件;
[0018]当判断出所述最高置信度满足预先设定的所述置信度条件时,将所述最高置信度对应的目标类别标签以及所述目标类别标签所对应的目标层级确定为所述待处理文本信息对应的层级类别标签。
[0019]作为一种可选的实施方式,在本专利技术第一方面中,所述根据每个所述独立层级对应的层级标识、每个剩余层级对应的层级标识以及每个所述剩余层级对应的类别标签,确定所述待处理文本信息对应的层级类别标签,包括:
[0020]根据所有剩余层级对应的类别标签之间是否存在所述关联关系的分析结果,将所有所述剩余层级划分为至少一个关联层级组;所有所述关联层级组的数量大于等于1;当所述关联层级组的数量大于1时,对于同一所述关联层级组,任一层级对应的类别标签与该关联层级组中的至少一个层级对应的类别标签存在所述关联关系,对于任意两个所述关联层级组,其中一个所述关联层级组中的任一层级的类别标签与另一个所述关联层级组中的任一层级的类别标签均不存在所述关联关系;
[0021]根据所有所述独立层级以及所有所述关联层级组的数量,从所有所述层级中确定待处理层级集合,所述待处理层级集合包括满足类别标签更正条件的所有第一层级和/或满足删除条件的所有第二层级;
[0022]当所述待处理层级集合包括所述第一层级时,对所述层级分类结果中每个所述第一层级对应的标签执行更正操作,以更新所述层级分类结果;
[0023]当所述待处理层级集合包括所述第二层级时,对所述层级分类结果中每个所述第二层级及对应的标签执行删除操作,以更新所述层级分类结果;
[0024]将更新后的所述层级分类结果确定为所述待处理文本信息对应的层级类别标签。
[0025]作为一种可选的实施方式,在本专利技术第一方面中,根据所有所述独立层级以及所有所述关联层级组的数量,从所有所述层级中确定待处理层级集合,包括:
[0026]当所有所述关联层级组的数量等于1时,对于每个所述独立层级,判断所述关联层级组中是否存在层级级别低于该独立层级的至少一个层级,得到该独立层级对应的判断结果;根据所有所述独立层级对应的判断结果,确定待处理层级集合;其中,当所述独立层级
对应的判断结果表示所述关联层级组中存在层级级别低于所述独立层级的至少一个层级时,所述独立层级为所述待处理层级集合中的第一层级;当所述独立层级对应的判断结果表示所述关联层级组中不存在层级级别低于所述独立层级的层级时,所述独立层级为所述待处理层级集合中的第二层级;
[0027]当所有所述关联层级组的数量大于1时,确定每个所述关联层级组对应的组置信度,从所有所述关联层级组中筛选满足预设组置信度条件的目标关联层级组;将所有所述独立层级以及除所述目标关联层级组之外的剩余关联层级组所包括的所有层级确定为待判断层级集合;
[0028]对于所述待判断层级集合中的每个待判断层级,判断所述目标关联层级组中是否存在层级级别低于该待判断层级的至少一个层级,得到该待判断层级对应的判断结果;根据所有所述待判断层级对应的判断结果,确定待处理层级集合;其中,当所述待判断层级对应的判断结果表示所述目标关联层级组中存在层级级别低于所述待判断层级的至少一个层级时,所述待判断层级为所述待处理层级集合中的第一层级;当所述待判断层级对应的判断结果表示所述目标关联层级组不存在层级级别低于所述待判断层级的层级时,所述待判断层级为所述待处理层级集合中的第二层级;
[0029]其中,层级级别高的层级对应的分类本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于层级分类模型的信息分类方法,其特征在于,所述方法包括:获取需要进行分类的待处理文本信息;将所述待处理文本信息输入至预先设定的层级分类模型,得到所述待处理文本信息的层级分类结果,所述层级分类结果包括层级集合中每个层级的分类结果,所述层级集合包括至少两个层级,不同层级对应不同的层级标识且不同层级对应不同的分类结果范围;根据所述层级分类结果确定所述待处理文本信息对应的层级类别标签。2.根据权利要求1所述的基于层级分类模型的信息分类方法,其特征在于,每个所述层级的分类结果包括每个所述层级对应的类别标签;其中,所述根据所述层级分类结果确定所述待处理文本信息对应的层级类别标签,包括:根据所述层级分类结果中所有所述层级对应的类别标签,分析每任意两个所述层级对应的类别标签是否存在关联关系,得到分析结果;当所述分析结果表示所有所述层级中每任意两个所述层级对应的类别标签均存在所述关联关系时,将所有所述层级对应的类别标签确定为所述待处理文本信息对应的层级类别标签;当所述分析结果表示所有所述层级中每任意两个所述层级对应的类别标签不均存在所述关联关系时,从所有所述层级中筛选出所有独立层级,根据每个所述独立层级对应的层级标识、每个剩余层级对应的层级标识以及每个所述剩余层级对应的类别标签,确定所述待处理文本信息对应的层级类别标签;其中,每个所述独立层级对应的类别标签与所有所述层级中除该独立层级之外的其它任一层级对应的类别标签均不存在所述关联关系;所有所述剩余层级是所有所述层级中除所有所述独立层级之外的层级。3.根据权利要求2所述的基于层级分类模型的信息分类方法,其特征在于,所述根据所述层级分类结果确定所述待处理文本信息对应的层级类别标签,还包括:当所述分析结果表示所有所述层级中每任意两个所述层级对应的类别标签均不存在所述关联关系时,确定每个所述层级对应的类别标签的置信度;从所有所述置信度中筛选出最高置信度,判断所述最高置信度是否满足预先设定的置信度条件;当判断出所述最高置信度满足预先设定的所述置信度条件时,将所述最高置信度对应的目标类别标签以及所述目标类别标签所对应的目标层级确定为所述待处理文本信息对应的层级类别标签。4.根据权利要求2所述的基于层级分类模型的信息分类方法,其特征在于,所述根据每个所述独立层级对应的层级标识、每个剩余层级对应的层级标识以及每个所述剩余层级对应的类别标签,确定所述待处理文本信息对应的层级类别标签,包括:根据所有剩余层级对应的类别标签之间是否存在所述关联关系的分析结果,将所有所述剩余层级划分为至少一个关联层级组;所有所述关联层级组的数量大于等于1;当所述关联层级组的数量大于1时,对于同一所述关联层级组,任一层级对应的类别标签与该关联层级组中的至少一个层级对应的类别标签存在所述关联关系,对于任意两个所述关联层级组,其中一个所述关联层级组中的任一层级的类别标签与另一个所述关联层级组中的任一
层级的类别标签均不存在所述关联关系;根据所有所述独立层级以及所有所述关联层级组的数量,从所有所述层级中确定待处理层级集合,所述待处理层级集合包括满足类别标签更正条件的所有第一层级和/或满足删除条件的所有第二层级;当所述待处理层级集合包括所述第一层级时,对所述层级分类结果中每个所述第一层级对应的标签执行更正操作,以更新所述层级分类结果;当所述待处理层级集合包括所述第二层级时,对所述层级分类结果中每个所述第二层级及对应的标签执行删除操作,以更新所述层级分类结果;将更新后的所述层级分类结果确定为所述待处理文本信息对应的层级类别标签。5.根据权利要求4所述的基于层级分类模型的信息分类方法,其特征在于,根据所有所述独立层级以及所有所述关联层级组的数量,从所有所述层级中确定待处理层级集合,包括:当所有所述关联层级组的数量等于1时,对于每个所述独立层级,判断所述关联层级组中是否存在层级级别低于该独立层级的至少一个层级,得到该独立层级对应的判断结果;根据所有所述独立层级对应的判断结果,确定待处理层级集合;其中,当所述独立层级对应的判断结果表示所述关联层级组中存在层级级别低于所述独立层级的至少一个层级时,所述独立层级为所述待处理层级集合中的第一层级;当所述独立层级对应的判断结果表示所述关联层级组中不存在层级级别低于所述独...

【专利技术属性】
技术研发人员:黄于晏钟艺豪
申请(专利权)人:有米科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1