信息分类方法、模型训练方法、相关装置及电子设备制造方法及图纸

技术编号：37189784 阅读：8 留言：0更新日期：2023-04-20 22:51

本申请公开了一种信息分类方法、模型训练方法、相关装置及电子设备，属于人工智能技术领域。该方法包括：获取第一信息和M个预设类别对应的M个标签信息，所述标签信息用于指示所述第一信息在所述预设类别下的状态；对第一信息进行第一向量表征，得到第一特征向量；以及对M个标签信息进行第二向量表征，得到M个第二特征向量；基于目标模型，基于第一特征向量和M个第二特征向量进行融合处理，得到M个标签信息对应的M个第三特征向量，第三特征向量用于表征标签信息与第一信息之间的关联关系，以及不同标签信息之间的关联关系；基于M个第三特征向量，对第一信息进行分类，得到第一目标类别，第一目标类别为M个预设类别中的类别。第一目标类别为M个预设类别中的类别。第一目标类别为M个预设类别中的类别。

全部详细技术资料下载

【技术实现步骤摘要】
信息分类方法、模型训练方法、相关装置及电子设备

[0001]本申请属于人工智能
，具体涉及一种信息分类方法、模型训练方法、相关装置及电子设备。

技术介绍

[0002]随着人工智能技术的高速发展，深度学习模型得到了广泛的应用，在一应用场景中，可以基于深度学习模型实现对多媒体信息如新闻资讯的分类，以基于分类进行信息推荐、搜索等。
[0003]目前，深度学习模型通常是对多媒体信息的文本特征或图像特征进行学习，以基于学习到的文本特征或图像特征进行信息分类，这种信息分类方式的分类准确性比较低。

技术实现思路

[0004]本申请实施例的目的是提供一种信息分类方法、模型训练方法、相关装置及电子设备，能够解决信息分类准确性比较低的问题。
[0005]第一方面，本申请实施例提供了一种信息分类方法，该方法包括：
[0006]获取第一信息和M个预设类别对应的M个标签信息，所述标签信息用于指示所述第一信息在所述预设类别下的状态，M为大于1的整数；
[0007]对所述第一信息进行第一向量表征，得到第一特征向量；以及对所述M个标签信息进行第二向量表征，得到M个第二特征向量；
[0008]基于目标模型，基于所述第一特征向量和所述M个第二特征向量进行融合处理，得到所述M个标签信息对应的M个第三特征向量，所述第三特征向量用于表征所述标签信息与所述第一信息之间的关联关系，以及不同标签信息之间的关联关系；
[0009]基于所述M个第三特征向量，对所述第一信息进行分类，得到第一目标类别，...

【技术保护点】

【技术特征摘要】
1.一种信息分类方法，其特征在于，所述方法包括：获取第一信息和M个预设类别对应的M个标签信息，所述标签信息用于指示所述第一信息在所述预设类别下的状态，M为大于1的整数；对所述第一信息进行第一向量表征，得到第一特征向量；以及对所述M个标签信息进行第二向量表征，得到M个第二特征向量；基于目标模型，基于所述第一特征向量和所述M个第二特征向量进行融合处理，得到所述M个标签信息对应的M个第三特征向量，所述第三特征向量用于表征所述标签信息与所述第一信息之间的关联关系，以及不同标签信息之间的关联关系；基于所述M个第三特征向量，对所述第一信息进行分类，得到第一目标类别，所述第一目标类别为所述M个预设类别中的类别。2.根据权利要求1所述的方法，其特征在于，所述基于目标模型，基于所述第一特征向量和所述M个第二特征向量进行融合处理，得到所述M个标签信息对应的M个第三特征向量，包括：将所述第一特征向量分别与所述M个第二特征向量进行相乘处理，得到M个第一权重；将所述M个第一权重与所述M个第二特征向量进行加权处理，得到第四特征向量；针对所述M个第二特征向量中的第i个第二特征向量，将所述第i个第二特征向量与所述第一特征向量进行相乘处理，以及将所述第i个第二特征向量与所述M个第二特征向量中，除所述第i个第二特征向量之外的其他第二特征向量进行相乘处理，得到M个第二权重；将所述M个第二权重与所述第一特征向量、所述其他第二特征向量进行加权处理，得到所述第i个第二特征向量对应的第五特征向量，i为小于或等于M的正整数；基于所述第四特征向量和所述第五特征向量进行融合处理，得到所述M个第三特征向量。3.根据权利要求2所述的方法，其特征在于，所述标签信息包括第一类型的第一标签信息和第二类型的第二标签信息，所述第一标签信息为位于第一层级的第一预设类别下的标签信息，所述第二标签信息为位于第二层级的第二预设类别下的标签信息，所述第二层级为所述第一层级的子层级，所述M个预设类别包括所述第一预设类别和所述第二预设类别；所述基于所述第四特征向量和所述第五特征向量进行融合处理，得到所述M个第三特征向量，包括：在所述第五特征向量用于表征所述第一标签信息的情况下，基于第一目标特征向量和所述第五特征向量进行融合处理，得到一个所述第三特征向量，所述第一目标特征向量包括：所述第四特征向量，以及M个第五特征向量中第一目标标签信息对应的特征向量，所述第一目标标签信息为所述第一标签信息对应的第二标签信息；在所述第五特征向量用于表征所述第二标签信息的情况下，基于第二目标特征向量和所述第五特征向量进行融合处理，得到一个所述第三特征向量，所述第二目标特征向量包括：所述第四特征向量，以及所述M个第五特征向量中第二目标标签信息对应的特征向量，所述第二目标标签信息为所述第二标签信息对应的第一标签信息。4.根据权利要求3所述的方法，其特征在于，所述基于第一目标特征向量和所述第五特征向量进行融合处理，得到一个所述第三特征向量，包括：将所述第五特征向量与所述第四特征向量进行相乘处理，以及将所述第五特征向量与
所述第一目标标签信息对应的特征向量进行相乘处理，得到至少两个第三权重；将所述至少两个第三权重与所述第一目标特征向量进行加权处理，得到一个所述第三特征向量。5.根据权利要求1所述的方法，其特征在于，所述基于所述M个第三特征向量，对所述第一信息进行分类，得到第一目标类别，包括：基于所述第三特征向量，确定第一激活值；基于所述第一激活值，确定所述第一信息的类别为所述第三特征向量对应的预设类别的第一概率值；基于所述第一概率值，确定所述第一目标类别。6.一种模型训练方法，其特征在于，所述方法包括：获取训练样本数据，所述训练样本数据包括第一样本信息和M个预设类别对应的M个第一标签样本信息，所述第一标签样本信息用于指示所述第一样本信息在所述预设类别下的状态，M为大于1的整数；对所述第一样本信息进行第一向量表征，得到第六特征向量；以及对M个第二标签样本信息进行第二向量表征，得到M个第七特征向量，所述M个第二标签样本信息基于所述M个第一标签样本信息确定；基于所述第六特征向量和所述M个第七特征向量进行融合处理，得到所述M个第二标签样本信息对应的M个第八特征向量；基于所述M个第八特征向量，确定M个输出信息；基于所述M个输出信息和所述第一标签样本信息，确定目标模型的网络损失值；基于所述网络损失值，更新所述目标模型的网络参数。7.根据权利要求6所述的方法，其特征在于，所述第一标签样本信息的标签内容包括第一标签状态值，所述第一标签状态值用于表征所述第一样本信息是否属于所述预设类别，所述第一标签样本信息包括正标签的标签样本信息和负标签的标签样本信息，所述正标签为所述第一标签状态值指示所述第一样本信息属于所述预设类别的标签，所述负标签为所述第一标签状态值指示所述第一样本信息不属于所述预设类别的标签，所述输出信息包括基于所述第八特征向量确定的第二激活值；所述基于所述M个输出信息和所述第一标签样本信息，确定目标模型的网络损失值，包括：基于第三预设类别对应的第二激活值，确定第一损失值，所述第三预设类别为所述正标签对应的预设类别；基于第四预设类别对应的第二激活值，确定第二损失值，所述第四预设类别为所述负标签对应的预设类别；基于所述第一损失值和所述第二损失值，确定所述网络损失值。8.根据权利要求7所述的方法，其特征在于，所述第一标签样本信息包括第一类型的第一目标标签样本信息和第二类型的第二目标标签样本信息，所述第一目标标签样本信息为位于第一层级的第一预设类别下的标签信息，所述第二目标标签样本信息为位于第二层级的第二预设类别下的标签信息，所述第二层级为所述第一层级的子层级，所述M个预设类别包括所述第一预设类别和所述第二预设类别；所述输出信息还包括所述第一样本信息的类别为所述预设类别的第二概率值；
所述方法还包括：将第一目标值与第二目标值进行比对，得到第三损失值，所述第一目标值包括所述第一样本信息的类别为所述正标签对应的第一预设类别的第二概率值，所述第二目标值包括所述第一样本信息的类别为所述正标签对应的第二预设类别的第二概率值；所述基于所述第一损失值和所述第二损失值，确定所述网络损失值，包括：将所述第一损失值、所述第二损失值和所述第三损失值进行聚合，得到所述网络损失值。9.根据权利要求6所述的方法，其特征在于，所述目标模型的训练阶段包括K个阶段，第一阶段和第二阶段为所述K个阶段中任意相邻的两个阶段，所述第一阶段位于所述第二阶段之前，K为大于1的整数；所述方法还包括：在所述目标模型的训练阶段位于所述第一阶段的情况下，将所述M个第一标签样本信息中第一数量的第一标签状态值设置为第二标签状态值，得到所述M个第二标签样本信息，所述第二标签状态值指示所述第一样本信息是否属于所述预设类别的结果为未知状态；在所述目标模型的训练阶段位于所述第二阶段的情况下，将所述M个第一标签样本信息中第二数量的第一标签状态值设置为所述第二标签状态值，得到所述M个第二标签样本信息；其中，所述第二数量大于所述第一数量。10.根据权利要求9所述的方法，其特征在于，所述基于所述M个输出信息和所述第一标签样本信息，确定目标模型的网络损失值，包括：基于所述M个输出信息、所述第一标签样本信息和目标参数，确定所述网络损失值；其中，所述目标参数用于调节所述第一样本信息的类别为所述预设类别的第二概率值与所述第一标签状态值的差异，第一差异大于第二差异，第一差异为：所述目标模型的训练阶段位于所述第一阶段时，所述第一样本信息的类别为所述预设类别的第二概率值与所述第一标签状态值的差异，所述第二差异为：所述目标模型的训练阶段位于所述第二阶段时，所述第一样本信息的类别为所述预设类别的第二概率值与所述第一标签状态值的差异。11.一种信息分类装置，其特征在于，所述装置包括：第一获取模块，用于获取第一信息和M个预设类别对应的M个标签信息，所述标签信息用于指示所述第一信息在所述预设类别下的状态，M为大于1的整数；第一向量表征模块，用于对所述第一信息进行第一向量表征，得到第一特征向量；第二向量表征模块，用于对所述M个标签信息进行第二向量表征...

【专利技术属性】
技术研发人员：罗龙强，
申请(专利权)人：维沃移动通信有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人