模型生成方法、情绪识别方法、装置、设备及存储介质制造方法及图纸

技术编号：31086643 阅读：21 留言：0更新日期：2021-12-01 12:40

本公开提供了模型生成方法、情绪识别方法、装置、电子设备及存储介质，涉及语音技术、自然语言处理等人工智能技术领域。具体实现方案为：将音频数据输入待训练的识别模型，获取针对所述音频数据输出的性别识别结果和情绪识别结果；基于所述性别识别结果、所述情绪识别结果和标注结果，调整所述待训练的识别模型，得到情绪识别模型。本公开实施例能够提高情绪识别的准确性。情绪识别的准确性。情绪识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
模型生成方法、情绪识别方法、装置、设备及存储介质

[0001]本公开涉及计算机
，进一步涉及语音技术、自然语言处理等人工智能
，尤其涉及一种模型生成方法、情绪识别方法、装置、电子设备及存储介质。

技术介绍

[0002]随着计算机技术的发展，人们可以通过计算机实现更多的新功能，情绪识别就是其中一种。
[0003]通过计算机进行情绪识别，包括通过检测外在可观测到的信息，对情绪状态进行判断。由于情绪是人类复杂的心理活动，因此，情绪识别的准确性的提高仍是一个需要长期关注的问题。

技术实现思路

[0004]本公开提供了一种模型生成方法、情绪识别方法、装置、电子设备及存储介质。
[0005]根据本公开的一方面，提供了一种模型生成方法，包括：
[0006]将音频数据输入待训练的识别模型，获取针对音频数据输出的性别识别结果和情绪识别结果；
[0007]基于性别识别结果、情绪识别结果和标注结果，调整待训练的识别模型，得到情绪识别模型。
[0008]根据本公开的另一方面，提供了一种情绪识别方法，包括：
[0009]将待识别的音频数据输入识别模型，得到情绪识别结果，识别模型为本公开任意一项实施例所提供的情绪识别模型。
[0010]根据本公开的另一方面，提供了一种模型生成装置，包括：
[0011]识别模块，用于将音频数据输入待训练的识别模型，获取针对音频数据输出的性别识别结果和情绪识别结果；
[0012]训练模块，用于基于性别识别结果、情绪识...

【技术保护点】

【技术特征摘要】
1.一种模型生成方法，包括：将音频数据输入待训练的识别模型，获取针对所述音频数据输出的性别识别结果和情绪识别结果；基于所述性别识别结果、所述情绪识别结果和标注结果，调整所述待训练的识别模型，得到情绪识别模型。2.根据权利要求1所述的方法，其中，所述将音频数据输入待训练的识别模型，获取针对所述音频数据输出的性别识别结果和情绪识别结果，包括：采用所述待训练的识别模型的前处理层，根据所述音频数据获取至少融合了情绪信息和性别信息的第一数据；采用所述待训练的识别模型的性别识别输出层，根据所述第一数据获得所述性别识别结果；采用所述待训练的识别模型的情绪识别输出层，根据所述第一数据获得所述情绪识别结果。3.根据权利要求2所述的方法，其中，所述根据所述音频数据获取至少融合了情绪信息和性别信息的第一数据，包括：对所述音频数据进行频域信息提取，获取第二数据；对所述第二数据进行卷积和池化计算，获取第三数据；采用双向长短期记忆神经网络对所述第三数据进行处理，获取第四数据；对所述第四数据进行自注意力权值计算，获取所述第一数据。4.根据权利要求1
‑
3中任意一项所述的方法，其中，所述方法还包括通过以下方式获取所述音频数据：对获取到的原始音频数据进行预处理，得到预处理结果；对所述预处理结果进行数据增强操作，获取所述原始音频数据的增强数据；将所述原始音频数据以及所述增强数据，作为所述音频数据。5.根据权利要求4所述的方法，其中，在所述数据增强操作为差分增强操作的情况下，所述对所述预处理结果进行数据增强操作，获取所述原始音频数据的增强数据，包括：提取所述原始音频数据的目标音频特征；对所述目标音频特征执行差分增强操作，获取所述原始音频数据的增强数据。6.根据权利要求4或5所述的方法，其中，所述对获取到的原始音频数据进行预处理，得到预处理结果，包括：对所述原始音频数据执行下述操作至少之一，以对所述原始音频数据进行预处理：改变所述原始音频数据的播放速率；在所述原始音频数据中添加混响；去除所述原始音频数据中的噪音；对所述原始音频数据进行时域通道掩盖操作；对所述原始音频数据进行频域通道掩盖操作。7.根据权利要求1
‑
6中任意一项所述的方法，其中，所述基于所述性别识别结果、所述情绪识别结果和标注结果，调整所述待训练的识别模型，包括：基于所述性别识别结果、所述情绪识别结果和所述标注结果进行损失计算，获取损失
值；根据所述损失值，调整所述待训练的识别模型。8.根据权利要求7所述的方法，其中，所述标注结果包括性别标注结果和情绪标注结果，所述基于所述性别识别结果、所述情绪识别结果和所述标注结果进行损失计算，获取损失值，包括：基于所述性别标注结果和性别识别结果，进行交叉熵损失计算，获取第一损失值；基于所述情绪标注结果和情绪识别结果，进行交叉熵损失计算，获取第二损失值；对所述第一损失值和所述第二损失值进行加权求和，将求和结果作为所述损失值。9.一种情绪识别方法，包括：将待识别的音频数据输入识别模型，得到情绪识别结果，所述识别模型为权利要求1
‑
8中任意一项所述的情绪识别模型。10.一种模型生成装置，包括：识别模块，用于将音频数据输入待训练的识别模型，获取针对所述音频数据输出的性别识别结果和情绪识别结果；训练模块，用于基于所述性别识别结果、所述情绪识别结果和标注结果，调整所述待训练的识别模型，得到情绪识别模型...

【专利技术属性】
技术研发人员：赵情恩，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人