System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种模型确定方法和相关装置制造方法及图纸_技高网

一种模型确定方法和相关装置制造方法及图纸

技术编号:40951855 阅读:3 留言:0更新日期:2024-04-18 20:27
本申请公开了一种模型确定方法和相关装置,首先获取具有对应的表达情绪的训练文本集合,从训练文本集合中确定文本组,在文本组包括各自对应的表达情绪互为相似情绪的第一训练文本和第二训练文本。然后根据文本组确定初始识别模型的输入数据,通过初始识别模型中的表征提取层,得到训练文本各自的情绪表征特征;根据距离区分条件,以及两个情绪表征特征的特征距离,生成与第一训练文本相关的特征损失函数。最后根据特征损失函数,以保持特征距离满足距离区分条件为优化目标,对初始识别模型进行模型训练得到情绪识别模型。能够对于相似情绪的训练文本进行区分,提升训练得到的情绪识别模型的识别精度,降低对易混淆的表达情绪的错误识别率。

【技术实现步骤摘要】

本申请涉及数据处理领域,特别是涉及一种模型确定方法和相关装置


技术介绍

1、语言在被表达时,表达情绪会随着语言内容的不同而有所区别。而文本是人们语言表达的文字化形式,故文本也具有对应的表达情绪。

2、相关技术中,主要采用神经网络模型,通过多分类的方式从多个表达情绪中来识别文本可能涉及的表达情绪。

3、然而,有一些表达情绪的相似性很高,相关技术中的神经网络模型对此难以区分,在情绪识别时容易混淆这类表达情绪,导致情绪识别精度难以满足识别需求。


技术实现思路

1、为了解决上述技术问题,本申请提供了一种模型确定方法和相关装置,能够对于相似情绪的训练文本进行区分,提升训练得到的情绪识别模型的识别精度,降低对易混淆的表达情绪的错误识别率。

2、本申请实施例公开了如下技术方案:

3、一方面,本申请实施例提供了一种模型确定方法,包括:

4、获取训练文本集合,所述训练文本集合中的训练文本具有对应的表达情绪;

5、从所述训练文本集合中确定文本组,所述文本组包括第一训练文本和第二训练文本,所述第一训练文本对应第一表达情绪,所述第二训练文本对应第二表达情绪,所述第一表达情绪和所述第二表达情绪为相似情绪;

6、根据所述文本组确定初始识别模型的输入数据,通过所述初始识别模型中的表征提取层,得到所述第一训练文本的第一情绪表征特征和所述第二训练文本的第二情绪表征特征;

7、根据距离区分条件,以及所述第一情绪表征特征和所述第二情绪表征特征的特征距离,生成与所述第一训练文本相关的特征损失函数;

8、根据所述特征损失函数,以保持所述特征距离满足所述距离区分条件为优化目标,对所述初始识别模型进行模型训练得到情绪识别模型,所述情绪识别模型中包括所述表征提取层和情绪识别层,所述情绪识别层用于根据所述表征提取层得到的待识别文本的情绪表征特征,确定所述待识别文本的预测表达情绪。

9、另一方面,本申请实施例提供了一种模型确定装置,所述装置包括:获取模块、第一确定模块、第二确定模块、生成模块及训练模块;

10、所述获取模块,用于获取训练文本集合,所述训练文本集合中的训练文本具有对应的表达情绪;

11、所述第一确定模块,用于从所述训练文本集合中确定文本组,所述文本组包括第一训练文本和第二训练文本,所述第一训练文本对应第一表达情绪,所述第二训练文本对应第二表达情绪,所述第一表达情绪和所述第二表达情绪为相似情绪;

12、所述第二确定模块,用于根据所述文本组确定初始识别模型的输入数据,通过所述初始识别模型中的表征提取层,得到所述第一训练文本的第一情绪表征特征和所述第二训练文本的第二情绪表征特征;

13、所述生成模块,用于根据距离区分条件,以及所述第一情绪表征特征和所述第二情绪表征特征的特征距离,生成与所述第一训练文本相关的特征损失函数;

14、所述训练模块,用于根据所述特征损失函数,以保持所述特征距离满足所述距离区分条件为优化目标,对所述初始识别模型进行模型训练得到情绪识别模型,所述情绪识别模型中包括所述表征提取层和情绪识别层,所述情绪识别层用于根据所述表征提取层得到的待识别文本的情绪表征特征,确定所述待识别文本的预测表达情绪。

15、又一方面,本申请实施例提供了一种计算机设备,计算机设备包括处理器以及存储器:

16、存储器用于存储计算机程序;

17、处理器用于根据计算机程序执行以上方面所述的方法。

18、又一方面。本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质用于存储计算机程序,计算机程序用于执行以上方面所述的方法。

19、又一方面,本申请实施例提供了一种包括计算机程序的计算机程序产品,当其在计算机设备上运行时,使得计算机设备执行以上方面所述的方法。

20、由上述技术方案可以看出,获取训练文本集合,其中的训练文本对应有表达情绪,在通过训练文本集合中的第一训练文本进行模型训练时,确定包括第一训练文本和第二训练文本的文本组,第二训练文本与第一训练文本对应的表达情绪为相似情绪,即容易在后续识别时产生混淆的表达情绪。通过初始识别模型的表征提取层,可以得到第一训练文本的第一情绪表征特征和第二训练文本的第二情绪表征特征,根据距离区分条件和两个情绪表征特征间的特征距离生成特征损失函数,并以保持该特征距离满足距离区分条件为优化目标,根据对该特征损失函数对初始识别模型进行模型训练,使得模型能够对于相似情绪的训练文本进行区分,提取出的情绪表征特征具有较高区分度,有效指导后续情绪识别层对表达情绪的识别,以此提升训练得到的情绪识别模型的识别精度,降低对易混淆的表达情绪的错误识别率。

本文档来自技高网...

【技术保护点】

1.一种模型确定方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述文本组还包括第三训练文本,所述第三训练文本对应第三表达情绪,所述第一表达情绪和所述第三表达情绪为相同情绪中的不同情绪级别,所述第三训练文本通过所述表征提取层得到的是第三情绪表征特征;

3.根据权利要求2所述的方法,其特征在于,所述文本组还包括第四训练文本和第五训练文本,所述第四训练文本对应第四表达情绪,所述第一表达情绪和所述第四表达情绪为相同情绪,所述第四训练文本通过所述表征提取层得到的是第四情绪表征特征,第五训练文本对应第五表达情绪,所述第一表达情绪和所述第五表达情绪为相反情绪,所述第五训练文本通过所述表征提取层得到的是第五情绪表征特征;

4.根据权利要求3所述的方法,其特征在于,多个所述三元组为三个所述三元组,分别为第一三元组、第二三元组和第三三元组,所述第一三元组包括第一训练文本、第四训练文本和第三训练文本,所述第二三元组包括第一训练文本、第四训练文本和第二训练文本,所述第三三元组包括第一训练文本、第三训练文本和第五训练文本。

5.根据权利要求4所述的方法,其特征在于,所述区分度阈值包括数值由小到大的第一区分度阈值、第二区分度阈值和第三区分度阈值;

6.根据权利要求1-5任意一项所述的方法,其特征在于,所述训练文本包括情绪标签,所述情绪标签用于标识所对应训练文本的表达情绪,所述方法还包括:

7.根据权利要求6所述的方法,其特征在于,所述情绪识别模型是所述初始识别模型通过N轮模型训练得到的,所述根据所述特征损失函数,以保持所述特征距离满足所述距离区分条件为优化目标,并根据所述识别损失函数,对所述初始识别模型进行模型训练得到情绪识别模型,包括:

8.根据权利要求7所述的方法,其特征在于,在所述剩余N-M轮模型训练中,所述表征提取层的学习率被设置为低于所述情绪识别层的学习率。

9.根据权利要求6所述的方法,其特征在于,当所述文本组还包括所述第三训练文本时,所述第一训练文本的第一情绪标签和所述第三训练文本的第三情绪标签为不同的情绪标签,或者,所述第一情绪标签和所述第三情绪标签为同一种情绪标签、但用于标识情绪强度的标签值不同。

10.根据权利要求1-5任意一项所述的方法,其特征在于,所述方法还包括:

11.根据权利要求1-5任意一项所述的方法,其特征在于,所述方法还包括:

12.一种模型确定装置,其特征在于,所述装置包括:获取模块、第一确定模块、第二确定模块、生成模块及训练模块;

13.一种计算机设备,其特征在于,所述计算机设备包括处理器以及存储器:

14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序在被计算机设备执行时实现执行权利要求1-11中任意一项所述的方法。

15.一种包括计算机程序的计算机程序产品,当其在计算机设备上运行时,使得所述计算机设备执行权利要求1-11中任意一项所述的方法。

...

【技术特征摘要】

1.一种模型确定方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述文本组还包括第三训练文本,所述第三训练文本对应第三表达情绪,所述第一表达情绪和所述第三表达情绪为相同情绪中的不同情绪级别,所述第三训练文本通过所述表征提取层得到的是第三情绪表征特征;

3.根据权利要求2所述的方法,其特征在于,所述文本组还包括第四训练文本和第五训练文本,所述第四训练文本对应第四表达情绪,所述第一表达情绪和所述第四表达情绪为相同情绪,所述第四训练文本通过所述表征提取层得到的是第四情绪表征特征,第五训练文本对应第五表达情绪,所述第一表达情绪和所述第五表达情绪为相反情绪,所述第五训练文本通过所述表征提取层得到的是第五情绪表征特征;

4.根据权利要求3所述的方法,其特征在于,多个所述三元组为三个所述三元组,分别为第一三元组、第二三元组和第三三元组,所述第一三元组包括第一训练文本、第四训练文本和第三训练文本,所述第二三元组包括第一训练文本、第四训练文本和第二训练文本,所述第三三元组包括第一训练文本、第三训练文本和第五训练文本。

5.根据权利要求4所述的方法,其特征在于,所述区分度阈值包括数值由小到大的第一区分度阈值、第二区分度阈值和第三区分度阈值;

6.根据权利要求1-5任意一项所述的方法,其特征在于,所述训练文本包括情绪标签,所述情绪标签用于标识所对应训练文本的表达情绪,所述方法还包括:

7.根据权利要求6所述的方法,其特征在于...

【专利技术属性】
技术研发人员:郭卉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1