一种分类处理的方法、模型训练的方法以及相关装置制造方法及图纸

技术编号:40310568 阅读:14 留言:0更新日期:2024-02-07 20:53
本申请实施例公开了一种分类处理的方法、模型训练的方法以及相关装置,至少涉及人工智能等技术,可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景,高效完成分类处理,提升识别效率和分类准确度。该分类处理的方法包括:获取目标对象的待识别描述信息;提取待识别描述信息的编码特征向量;将待识别描述信息的编码特征向量输入至目标分类模型,以至少得到目标对象的一级预测类目和二级预测类目,目标分类模型是以训练对象对应的目标一级类目、目标二级类目、一级标签及二级标签为训练数据对预设分类模型进行训练得到的机器学习模型,目标二级类目是预设分类模型对训练对象的描述信息的编码特征向量与二级类目的语义向量进行预测得到。

【技术实现步骤摘要】

本申请实施例涉及人工智能,具体涉及一种分类处理的方法、模型训练的方法以及相关装置


技术介绍

1、标题等描述信息是文本、视频或者图像等对象的主要成分之一。在结合自然语言处理等基础算法的基础上,纳入考虑描述信息,便可完成对文本的解析,从而强化对象的语义信息的理解。

2、在基于文本、视频或者图像中的描述信息对对象进行分类的过程中,传统分类方式通常是将分类任务拆分成多个子分类任务,进而通过基于transformers的双向编码器表示(bidirectional encoder representation from transformers,bert)等模型直接预测得到产品对象的二级类目,进而再由该二级类目回溯一级类目。然而,对于二级类目这种子类目,往往面临着训练数据量较少的问题,导致需要使用较多的计算资源来获得海量的训练数据,并且还需要引入除了描述信息以外的知识来增强模型的识别能力,但这并不利于快速且高效地完成对文本、视频或者图像等产品对象的分类识别处理,识别效率和准确度均欠佳。


技术实现思路

1、本本文档来自技高网...

【技术保护点】

1.一种分类处理的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,将所述待识别描述信息的编码特征向量输入至目标分类模型,以得到所述目标对象的分类结果,包括:

3.根据权利要求2所述的方法,其特征在于,基于所述待识别描述信息的编码特征向量和预设二级标签确定所述目标对象的二级类目的语义向量,包括:

4.根据权利要求3所述的方法,其特征在于,基于所述预设二级标签从待识别描述信息的编码特征向量中确定多个目标特征向量,包括:

5.根据权利要求4所述的方法,其特征在于,基于所述第一卡方值从所述多个待识别文本词的编码特征向量中确定多个...

【技术特征摘要】

1.一种分类处理的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,将所述待识别描述信息的编码特征向量输入至目标分类模型,以得到所述目标对象的分类结果,包括:

3.根据权利要求2所述的方法,其特征在于,基于所述待识别描述信息的编码特征向量和预设二级标签确定所述目标对象的二级类目的语义向量,包括:

4.根据权利要求3所述的方法,其特征在于,基于所述预设二级标签从待识别描述信息的编码特征向量中确定多个目标特征向量,包括:

5.根据权利要求4所述的方法,其特征在于,基于所述第一卡方值从所述多个待识别文本词的编码特征向量中确定多个目标特征向量,包括:

6.根据权利要求2至5中任一项所述的方法,其特征在于,基于所述目标分类模型对所述待识别描述信息的编码特征向量和所述目标对象的二级类目的语义向量进行预测处理,得到所述目标对象的二级预测类目,包括:

7.根据权利要求6所述的方法,其特征在于,基于所述待识别描述信息的编码特征向量与所述目标对象的二级类目的语义向量确定目标类目分布,包括:

8.一种模型训练的方法,其特征在于,包括:

9.根据权利要求8所述的方法,其特征在于,基于所述描述信息的编码特征向量与所述二级标签确定所述训练对象的二级类目的语义向量,包括:

10.根据权利要求9所述的方法,其特征在于,基于所述二级标签从所述描述信息的编码特征向量中确定多个关键特征向量,包括:

11.根据权利要求10所述的方法,其特征...

【专利技术属性】
技术研发人员:黄剑辉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1