多媒体内容分类方法、装置、电子设备和存储介质制造方法及图纸

技术编号:31583498 阅读:16 留言:0更新日期:2021-12-25 11:27
本发明专利技术实施例公开了多媒体内容分类方法、装置、电子设备和存储介质;可获取包括内容样本和内容样本对应的层级分类标签的内容样本集合,采用待训练的层次分类模型对内容样本进行内容分类,得到各层级分类结果,根据各层级分类结果和层级分类标签,计算各分类层级对应的损失,根据基于模型的当前训练次数与预设的总训练次数之间的比例计算得到的各分类层级对应的损失权重和损失计算总损失,根据总损失调整模型,得到训练后的层次分类模型,通过训练后的层次分类模型对待分类内容分类;因此,可以无需人工设置对模型中各层级损失的侧重程度,避免了人为因素影响模型训练,本发明专利技术实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。驾驶等各种场景。驾驶等各种场景。

【技术实现步骤摘要】
多媒体内容分类方法、装置、电子设备和存储介质


[0001]本专利技术涉及多媒体内容处理领域,具体涉及多媒体内容分类方法、装置、电子设备和存储介质。

技术介绍

[0002]层次分类(Hierarchical Multi

Label Classification)是自然语言处理(Natural Language Processing,NLP)和计算机视觉(Computer Vision,CV)等领域的多分类中重要的一项任务,其主要的特点在于,层次分类中的类目标签具有上下级的关系,上级标签是下级标签的父级,越往下级层次分类的粒度越细。
[0003]目前,在对可以对文本进行分类的层次分类模型进行训练时采取的主要方法是,由人工确认对层级分类模型中各层级的损失的侧重程度,最终综合各层级的损失作为层次分类模型的总损失以调整层次分类模型。但是采用这种方案,不能够保证人工确认的侧重程度是合理的,具有一定的主观性,且由人工设定对各层级损失的侧重程度,则侧重程度不能够自动根据训练情况进行调整。

技术实现思路

[0004]本专利技术实施例提供一种多媒体内容分类方法、装置、电子设备和存储介质,可以无需人工设置对层级分类模型中各层级的损失的侧重程度,节约人力资源,在保障层次分类模型总损失的准确性的基础上避免人为因素对模型训练过程的影响。
[0005]本专利技术实施例提供一种多媒体内容分类方法,包括:
[0006]获取内容样本集合,所述内容样本集合包括内容样本以及所述内容样本对应的至少两个层级分类标签,所述层级分类标签之间具有层级关系;
[0007]采用待训练的层次分类模型,对所述内容样本进行内容分类,得到所述内容样本对应的各层级分类结果;
[0008]根据所述各层级分类结果以及所述层级分类标签,计算所述待训练的层次分类模型在各分类层级对应的损失;
[0009]根据所述各分类层级对应的损失权重以及所述各分类层级对应的损失,计算所述待训练的层次分类模型的总损失,其中,所述各分类层级对应的损失权重基于所述待训练的层次分类模型的当前训练次数与预设的总训练次数之间的比例计算得到;
[0010]根据所述总损失,对所述待训练的层次分类模型进行调整,得到训练后的层次分类模型,以使得所述训练后的层次分类模型对待分类内容进行内容分类。
[0011]相应的,本专利技术实施例还提供一种多媒体内容分类装置,包括:
[0012]样本获取单元,用于获取内容样本集合,所述内容样本集合包括内容样本以及所述内容样本对应的至少两个层级分类标签,所述层级分类标签之间具有层级关系;
[0013]层级分类单元,用于采用待训练的层次分类模型,对所述内容样本进行内容分类,得到所述内容样本对应的各层级分类结果;
[0014]分层损失计算单元,用于根据所述各层级分类结果以及所述层级分类标签,计算所述待训练的层次分类模型在各分类层级对应的损失;
[0015]总损失计算单元,用于根据所述各分类层级对应的损失权重以及所述各分类层级对应的损失,计算所述待训练的层次分类模型的总损失,其中,所述各分类层级对应的损失权重基于所述待训练的层次分类模型的当前训练次数与预设的总训练次数之间的比例计算得到;
[0016]模型调整单元,用于根据所述总损失,对所述待训练的层次分类模型进行调整,得到训练后的层次分类模型,以使得所述训练后的层次分类模型对待分类内容进行内容分类。
[0017]可选的,所述层次分类模型包括第一分类模型和所述第一分类模型对应的至少一个第二分类模型,所述第一分类模型与所述第二分类模型之间具有层级关系;
[0018]所述层级分类单元,用于采用待训练的第一分类模型,对所述内容样本进行内容分类,得到所述内容样本对应的第一层级分类结果;
[0019]采用待训练的第二分类模型,对所述内容样本进行内容分类,得到所述内容样本对应的第二层级分类结果;
[0020]将所述第一层级分类结果和所述第二层级分类结果,作为所述内容样本对应的各层级分类结果。
[0021]可选的,所述层级分类单元,用于采用待训练的所述第一分类模型,对所述内容样本进行内容分类,得到所述内容样本对应的第一层级分类结果;
[0022]基于所述第一层级分类结果以及预设的第一层级分类结果与第二分类任务的对应关系,确定所述第一层级分类结果对应的第二分类任务;
[0023]采用待训练的所述第二分类模型,对所述内容样本根据所述第二分类任务进行内容分类,得到所述内容样本对应的第二层级分类结果;
[0024]将所述第一层级分类结果和所述第二层级分类结果,作为所述内容样本对应的各层级分类结果。
[0025]可选的,所述层级分类标签至少包括第一层级分类标签和第二层级分类标签,所述分层损失计算单元,用于通过所述第一层级分类结果和所述第一层级分类标签,计算所述第一分类模型的第一损失;
[0026]通过所述第二层级分类结果和所述第二层级分类标签,计算所述第二分类模型的第二损失;
[0027]将所述第一损失和所述第二损失作为所述待训练的层次分类模型在各分类层级对应的损失。
[0028]可选的,本专利技术实施例提供的多媒体内容分类装置还包括权重确定单元,用于基于所述层次分类模型的当前训练次数与预设的总训练次数之间的比例,确定所述待训练的层次分类模型的损失侧重度;
[0029]根据所述损失侧重度,确定所述第一损失对应的第一权重和所述第二损失对应的第二权重;
[0030]将所述第一权重和所述第二权重作为所述各分类层级对应的损失权重。
[0031]可选的,所述权重确定单元,用于从所述第一损失和所述第二损失中确定目标损
失;
[0032]基于所述损失侧重度,确定所述目标损失对应的目标权重;
[0033]根据所述目标权重,确定所述第一损失和所述第二损失中除所述目标损失之外另一损失对应的适应权重;
[0034]根据所述目标损失对应的目标权重以及另一损失对应的适应权重,确定所述第一损失对应的第一权重和所述第二损失对应的第二权重。
[0035]可选的,所述权重确定单元,用于基于所述损失侧重度以及预设的权重计算第一参数,确定第一参考参数;
[0036]比较所述第一参考参数和预设的权重计算第二参数,当所述第一参考参数大于所述权重计算第二参数时,将所述第一参考参数作为所述目标损失对应的目标权重。
[0037]可选的,本专利技术实施例提供的多媒体内容分类装置,还包括内容分类单元,用于获取所述待分类内容;
[0038]采用所述训练后的层次分类模型,对所述待分类内容进行内容分类,得到所述待分类内容对应的各层级分类结果。
[0039]相应的,本专利技术实施例还提供一种电子设备,包括存储器和处理器;所述存储器存储有应用程序,所述处理器用于运行所述存储器内的应用程序,以执行本专利技术实施例所提供的任一种多媒体内容分类方法中的步骤。
[004本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多媒体内容分类方法,其特征在于,包括:获取内容样本集合,所述内容样本集合包括内容样本以及所述内容样本对应的至少两个层级分类标签,所述层级分类标签之间具有层级关系;采用待训练的层次分类模型,对所述内容样本进行内容分类,得到所述内容样本对应的各层级分类结果;根据所述各层级分类结果以及所述层级分类标签,计算所述待训练的层次分类模型在各分类层级对应的损失;根据所述各分类层级对应的损失权重以及所述各分类层级对应的损失,计算所述待训练的层次分类模型的总损失,其中,所述各分类层级对应的损失权重基于所述待训练的层次分类模型的当前训练次数与预设的总训练次数之间的比例计算得到;根据所述总损失,对所述待训练的层次分类模型进行调整,得到训练后的层次分类模型,以使得所述训练后的层次分类模型对待分类内容进行内容分类。2.根据权利要求1所述的多媒体内容分类方法,其特征在于,所述层次分类模型包括第一分类模型和所述第一分类模型对应的至少一个第二分类模型,所述第一分类模型与所述第二分类模型之间具有层级关系;所述采用待训练的层次分类模型,对所述内容样本进行内容分类,得到所述内容样本对应的各层级分类结果,包括:采用待训练的第一分类模型,对所述内容样本进行内容分类,得到所述内容样本对应的第一层级分类结果;采用待训练的第二分类模型,对所述内容样本进行内容分类,得到所述内容样本对应的第二层级分类结果;将所述第一层级分类结果和所述第二层级分类结果,作为所述内容样本对应的各层级分类结果。3.根据权利要求1所述的多媒体内容分类方法,其特征在于,所述层次分类模型包括第一分类模型和所述第一分类模型对应的至少一个第二分类模型,所述第一分类模型和所述第二分类模型之间具有层级关系;所述采用待训练的层次分类模型,对所述内容样本进行内容分类,得到所述内容样本对应的各层级分类结果,包括:采用待训练的所述第一分类模型,对所述内容样本进行内容分类,得到所述内容样本对应的第一层级分类结果;基于所述第一层级分类结果以及预设的第一层级分类结果与第二分类任务的对应关系,确定所述第一层级分类结果对应的第二分类任务;采用待训练的所述第二分类模型,对所述内容样本根据所述第二分类任务进行内容分类,得到所述内容样本对应的第二层级分类结果;将所述第一层级分类结果和所述第二层级分类结果,作为所述内容样本对应的各层级分类结果。4.根据权利要求2

3任一项所述的多媒体内容分类方法,其特征在于,所述层级分类标签至少包括第一层级分类标签和第二层级分类标签;所述根据所述各层级分类结果以及所述层级分类标签,计算所述待训练的层次分类模
型在各分类层级对应的损失,包括:通过所述第一层级分类结果和所述第一层级分类标签,计算所述第一分类模型的第一损失;通过所述第二层级分类结果和所述第二层级分类标签,计算所述第二分类模型的第二损失;将所述第一损失和所述第二损失作为所述待训练的层次分类模型在各分类层级对应的损失。5.根据权利要求4所述的多媒体内容分类方法,其特征在于,所述根据所述各分类层级对应的损失权重以及所述各分类层级对应的损失,计算所述待训练的...

【专利技术属性】
技术研发人员:黄剑辉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1