信息分类方法、模型训练方法、相关装置及电子设备制造方法及图纸

技术编号:37189784 阅读:8 留言:0更新日期:2023-04-20 22:51
本申请公开了一种信息分类方法、模型训练方法、相关装置及电子设备,属于人工智能技术领域。该方法包括:获取第一信息和M个预设类别对应的M个标签信息,所述标签信息用于指示所述第一信息在所述预设类别下的状态;对第一信息进行第一向量表征,得到第一特征向量;以及对M个标签信息进行第二向量表征,得到M个第二特征向量;基于目标模型,基于第一特征向量和M个第二特征向量进行融合处理,得到M个标签信息对应的M个第三特征向量,第三特征向量用于表征标签信息与第一信息之间的关联关系,以及不同标签信息之间的关联关系;基于M个第三特征向量,对第一信息进行分类,得到第一目标类别,第一目标类别为M个预设类别中的类别。第一目标类别为M个预设类别中的类别。第一目标类别为M个预设类别中的类别。

【技术实现步骤摘要】
信息分类方法、模型训练方法、相关装置及电子设备


[0001]本申请属于人工智能
,具体涉及一种信息分类方法、模型训练方法、相关装置及电子设备。

技术介绍

[0002]随着人工智能技术的高速发展,深度学习模型得到了广泛的应用,在一应用场景中,可以基于深度学习模型实现对多媒体信息如新闻资讯的分类,以基于分类进行信息推荐、搜索等。
[0003]目前,深度学习模型通常是对多媒体信息的文本特征或图像特征进行学习,以基于学习到的文本特征或图像特征进行信息分类,这种信息分类方式的分类准确性比较低。

技术实现思路

[0004]本申请实施例的目的是提供一种信息分类方法、模型训练方法、相关装置及电子设备,能够解决信息分类准确性比较低的问题。
[0005]第一方面,本申请实施例提供了一种信息分类方法,该方法包括:
[0006]获取第一信息和M个预设类别对应的M个标签信息,所述标签信息用于指示所述第一信息在所述预设类别下的状态,M为大于1的整数;
[0007]对所述第一信息进行第一向量表征,得到第一特征向量;以及对所述M个标签信息进行第二向量表征,得到M个第二特征向量;
[0008]基于目标模型,基于所述第一特征向量和所述M个第二特征向量进行融合处理,得到所述M个标签信息对应的M个第三特征向量,所述第三特征向量用于表征所述标签信息与所述第一信息之间的关联关系,以及不同标签信息之间的关联关系;
[0009]基于所述M个第三特征向量,对所述第一信息进行分类,得到第一目标类别,所述第一目标类别为所述M个预设类别中的类别。
[0010]第二方面,本申请实施例提供了一种模型训练方法,该方法包括:
[0011]获取训练样本数据,所述训练样本数据包括第一样本信息和M个预设类别对应的M个第一标签样本信息,所述第一标签样本信息用于指示所述第一样本信息在所述预设类别下的状态,M为大于1的整数;
[0012]对所述第一样本信息进行第一向量表征,得到第六特征向量;以及对M个第二标签样本信息进行第二向量表征,得到M个第七特征向量,所述M个第二标签样本信息基于所述M个第一标签样本信息确定;
[0013]基于所述第六特征向量和所述M个第七特征向量进行融合处理,得到所述M个第二标签样本信息对应的M个第八特征向量;基于所述M个第八特征向量,确定M个输出信息;
[0014]基于所述M个输出信息和所述第一标签样本信息,确定目标模型的网络损失值;
[0015]基于所述网络损失值,更新所述目标模型的网络参数。
[0016]第三方面,本申请实施例提供了一种信息分类装置,该装置包括:
[0017]第一获取模块,用于获取第一信息和M个预设类别对应的M个标签信息,所述标签信息用于指示所述第一信息在所述预设类别下的状态,M为大于1的整数;
[0018]第一向量表征模块,用于对所述第一信息进行第一向量表征,得到第一特征向量;
[0019]第二向量表征模块,用于对所述M个标签信息进行第二向量表征,得到M个第二特征向量;
[0020]融合处理模块,用于基于目标模型,基于所述第一特征向量和所述M个第二特征向量进行融合处理,得到所述M个标签信息对应的M个第三特征向量,所述第三特征向量用于表征所述标签信息与所述第一信息之间的关联关系,以及不同标签信息之间的关联关系;
[0021]分类模块,用于基于所述M个第三特征向量,对所述第一信息进行分类,得到第一目标类别,所述第一目标类别为所述M个预设类别中的类别。
[0022]第四方面,本申请实施例提供了一种模型训练装置,该装置包括:
[0023]第二获取模块,用于获取训练样本数据,所述训练样本数据包括第一样本信息和M个预设类别对应的M个第一标签样本信息,所述第一标签样本信息用于指示所述第一样本信息在所述预设类别下的状态,M为大于1的整数;
[0024]第一向量表征模块,用于对所述第一样本信息进行第一向量表征,得到第六特征向量;
[0025]第二向量表征模块,用于对M个第二标签样本信息进行第二向量表征,得到M个第七特征向量,所述M个第二标签样本信息基于所述M个第一标签样本信息确定;
[0026]融合处理模块,用于基于所述第六特征向量和所述M个第七特征向量进行融合处理,得到所述M个第二标签样本信息对应的M个第八特征向量;
[0027]第一确定模块,用于基于所述M个第八特征向量,确定M个输出信息;
[0028]第二确定模块,用于基于所述M个输出信息和所述第一标签样本信息,确定目标模型的网络损失值;
[0029]更新模块,用于基于所述网络损失值,更新所述目标模型的网络参数。
[0030]第五方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的信息分类方法的步骤,或者如第二方面所述的模型训练方法的步骤。
[0031]第六方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的信息分类方法的步骤,或者如第二方面所述的模型训练方法的步骤。
[0032]第七方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的信息分类方法的步骤,或者如第二方面所述的模型训练方法的步骤。
[0033]在本申请实施例中,通过获取第一信息和M个预设类别对应的M个标签信息,所述标签信息用于指示所述第一信息在所述预设类别下的状态;对所述第一信息进行第一向量表征,得到第一特征向量;以及对所述M个标签信息进行第二向量表征,得到M个第二特征向量;基于目标模型,基于所述第一特征向量和所述M个第二特征向量进行融合处理,得到所述M个标签信息对应的M个第三特征向量,所述第三特征向量用于表征所述标签信息与所述
第一信息之间的关联关系,以及不同标签信息之间的关联关系;基于所述M个第三特征向量,对所述第一信息进行分类,得到第一目标类别,所述第一目标类别为所述M个预设类别中的类别。如此,通过目标模型对第一信息和多个预设类别对应的标签信息进行融合处理,使得目标模型可以学习到标签信息与第一信息之间的关联关系,以及不同标签信息之间的关联关系,从而可以提高信息分类的准确性。
附图说明
[0034]图1是本申请实施例提供的信息分类方法的流程图;
[0035]图2是涉及两个层级的新闻资讯的类别体系的样例示意图;
[0036]图3是一示例的目标模型的结构示意图;
[0037]图4是第一标签信息的特征解码操作示意图;
[0038]图5是第二标签信息的特征解码操作示意图;
[0039]图6是本申请实施例提供的模型训练方法的流程图;
[0040]图7是本申请实施例提供的信息本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息分类方法,其特征在于,所述方法包括:获取第一信息和M个预设类别对应的M个标签信息,所述标签信息用于指示所述第一信息在所述预设类别下的状态,M为大于1的整数;对所述第一信息进行第一向量表征,得到第一特征向量;以及对所述M个标签信息进行第二向量表征,得到M个第二特征向量;基于目标模型,基于所述第一特征向量和所述M个第二特征向量进行融合处理,得到所述M个标签信息对应的M个第三特征向量,所述第三特征向量用于表征所述标签信息与所述第一信息之间的关联关系,以及不同标签信息之间的关联关系;基于所述M个第三特征向量,对所述第一信息进行分类,得到第一目标类别,所述第一目标类别为所述M个预设类别中的类别。2.根据权利要求1所述的方法,其特征在于,所述基于目标模型,基于所述第一特征向量和所述M个第二特征向量进行融合处理,得到所述M个标签信息对应的M个第三特征向量,包括:将所述第一特征向量分别与所述M个第二特征向量进行相乘处理,得到M个第一权重;将所述M个第一权重与所述M个第二特征向量进行加权处理,得到第四特征向量;针对所述M个第二特征向量中的第i个第二特征向量,将所述第i个第二特征向量与所述第一特征向量进行相乘处理,以及将所述第i个第二特征向量与所述M个第二特征向量中,除所述第i个第二特征向量之外的其他第二特征向量进行相乘处理,得到M个第二权重;将所述M个第二权重与所述第一特征向量、所述其他第二特征向量进行加权处理,得到所述第i个第二特征向量对应的第五特征向量,i为小于或等于M的正整数;基于所述第四特征向量和所述第五特征向量进行融合处理,得到所述M个第三特征向量。3.根据权利要求2所述的方法,其特征在于,所述标签信息包括第一类型的第一标签信息和第二类型的第二标签信息,所述第一标签信息为位于第一层级的第一预设类别下的标签信息,所述第二标签信息为位于第二层级的第二预设类别下的标签信息,所述第二层级为所述第一层级的子层级,所述M个预设类别包括所述第一预设类别和所述第二预设类别;所述基于所述第四特征向量和所述第五特征向量进行融合处理,得到所述M个第三特征向量,包括:在所述第五特征向量用于表征所述第一标签信息的情况下,基于第一目标特征向量和所述第五特征向量进行融合处理,得到一个所述第三特征向量,所述第一目标特征向量包括:所述第四特征向量,以及M个第五特征向量中第一目标标签信息对应的特征向量,所述第一目标标签信息为所述第一标签信息对应的第二标签信息;在所述第五特征向量用于表征所述第二标签信息的情况下,基于第二目标特征向量和所述第五特征向量进行融合处理,得到一个所述第三特征向量,所述第二目标特征向量包括:所述第四特征向量,以及所述M个第五特征向量中第二目标标签信息对应的特征向量,所述第二目标标签信息为所述第二标签信息对应的第一标签信息。4.根据权利要求3所述的方法,其特征在于,所述基于第一目标特征向量和所述第五特征向量进行融合处理,得到一个所述第三特征向量,包括:将所述第五特征向量与所述第四特征向量进行相乘处理,以及将所述第五特征向量与
所述第一目标标签信息对应的特征向量进行相乘处理,得到至少两个第三权重;将所述至少两个第三权重与所述第一目标特征向量进行加权处理,得到一个所述第三特征向量。5.根据权利要求1所述的方法,其特征在于,所述基于所述M个第三特征向量,对所述第一信息进行分类,得到第一目标类别,包括:基于所述第三特征向量,确定第一激活值;基于所述第一激活值,确定所述第一信息的类别为所述第三特征向量对应的预设类别的第一概率值;基于所述第一概率值,确定所述第一目标类别。6.一种模型训练方法,其特征在于,所述方法包括:获取训练样本数据,所述训练样本数据包括第一样本信息和M个预设类别对应的M个第一标签样本信息,所述第一标签样本信息用于指示所述第一样本信息在所述预设类别下的状态,M为大于1的整数;对所述第一样本信息进行第一向量表征,得到第六特征向量;以及对M个第二标签样本信息进行第二向量表征,得到M个第七特征向量,所述M个第二标签样本信息基于所述M个第一标签样本信息确定;基于所述第六特征向量和所述M个第七特征向量进行融合处理,得到所述M个第二标签样本信息对应的M个第八特征向量;基于所述M个第八特征向量,确定M个输出信息;基于所述M个输出信息和所述第一标签样本信息,确定目标模型的网络损失值;基于所述网络损失值,更新所述目标模型的网络参数。7.根据权利要求6所述的方法,其特征在于,所述第一标签样本信息的标签内容包括第一标签状态值,所述第一标签状态值用于表征所述第一样本信息是否属于所述预设类别,所述第一标签样本信息包括正标签的标签样本信息和负标签的标签样本信息,所述正标签为所述第一标签状态值指示所述第一样本信息属于所述预设类别的标签,所述负标签为所述第一标签状态值指示所述第一样本信息不属于所述预设类别的标签,所述输出信息包括基于所述第八特征向量确定的第二激活值;所述基于所述M个输出信息和所述第一标签样本信息,确定目标模型的网络损失值,包括:基于第三预设类别对应的第二激活值,确定第一损失值,所述第三预设类别为所述正标签对应的预设类别;基于第四预设类别对应的第二激活值,确定第二损失值,所述第四预设类别为所述负标签对应的预设类别;基于所述第一损失值和所述第二损失值,确定所述网络损失值。8.根据权利要求7所述的方法,其特征在于,所述第一标签样本信息包括第一类型的第一目标标签样本信息和第二类型的第二目标标签样本信息,所述第一目标标签样本信息为位于第一层级的第一预设类别下的标签信息,所述第二目标标签样本信息为位于第二层级的第二预设类别下的标签信息,所述第二层级为所述第一层级的子层级,所述M个预设类别包括所述第一预设类别和所述第二预设类别;所述输出信息还包括所述第一样本信息的类别为所述预设类别的第二概率值;
所述方法还包括:将第一目标值与第二目标值进行比对,得到第三损失值,所述第一目标值包括所述第一样本信息的类别为所述正标签对应的第一预设类别的第二概率值,所述第二目标值包括所述第一样本信息的类别为所述正标签对应的第二预设类别的第二概率值;所述基于所述第一损失值和所述第二损失值,确定所述网络损失值,包括:将所述第一损失值、所述第二损失值和所述第三损失值进行聚合,得到所述网络损失值。9.根据权利要求6所述的方法,其特征在于,所述目标模型的训练阶段包括K个阶段,第一阶段和第二阶段为所述K个阶段中任意相邻的两个阶段,所述第一阶段位于所述第二阶段之前,K为大于1的整数;所述方法还包括:在所述目标模型的训练阶段位于所述第一阶段的情况下,将所述M个第一标签样本信息中第一数量的第一标签状态值设置为第二标签状态值,得到所述M个第二标签样本信息,所述第二标签状态值指示所述第一样本信息是否属于所述预设类别的结果为未知状态;在所述目标模型的训练阶段位于所述第二阶段的情况下,将所述M个第一标签样本信息中第二数量的第一标签状态值设置为所述第二标签状态值,得到所述M个第二标签样本信息;其中,所述第二数量大于所述第一数量。10.根据权利要求9所述的方法,其特征在于,所述基于所述M个输出信息和所述第一标签样本信息,确定目标模型的网络损失值,包括:基于所述M个输出信息、所述第一标签样本信息和目标参数,确定所述网络损失值;其中,所述目标参数用于调节所述第一样本信息的类别为所述预设类别的第二概率值与所述第一标签状态值的差异,第一差异大于第二差异,第一差异为:所述目标模型的训练阶段位于所述第一阶段时,所述第一样本信息的类别为所述预设类别的第二概率值与所述第一标签状态值的差异,所述第二差异为:所述目标模型的训练阶段位于所述第二阶段时,所述第一样本信息的类别为所述预设类别的第二概率值与所述第一标签状态值的差异。11.一种信息分类装置,其特征在于,所述装置包括:第一获取模块,用于获取第一信息和M个预设类别对应的M个标签信息,所述标签信息用于指示所述第一信息在所述预设类别下的状态,M为大于1的整数;第一向量表征模块,用于对所述第一信息进行第一向量表征,得到第一特征向量;第二向量表征模块,用于对所述M个标签信息进行第二向量表征...

【专利技术属性】
技术研发人员:罗龙强
申请(专利权)人:维沃移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1