语音情绪波动分析方法及装置制造方法及图纸

技术编号：23988079 阅读：33 留言：0更新日期：2020-04-29 14:34

本发明专利技术实施例提供一种语音情绪波动分析方法，包括：获取待测语音数据的第一音频特征和第一文字特征；基于预先训练好的音频识别模型中的音频特征提取网络，提取第一音频特征中的第二音频特征；基于预先训练好的文字识别模型中的文字特征提取网络，提取第一文字特征中的第二文字特征；识别第二音频特征，获取音频情绪识别结果；识别第二文字特征，获取文字情绪识别结果；对音频情绪识别结果和文字情绪识别结果进行融合处理，得到情绪识别结果，并将所述情绪识别结果发送至关联终端。本发明专利技术通过双通道语音情绪识别方法及绘制情绪值热图，给客服质检提供具象化的参考和帮助，使评价结果更加客观，最终帮助企业提高客服服务质量，改善客户体验。

Analysis method and device of voice emotion fluctuation

全部详细技术资料下载

【技术实现步骤摘要】
语音情绪波动分析方法及装置
本专利技术涉及互联网
，尤其涉及一种语音情绪波动分析方法及装置。
技术介绍
随着人工智能技术的发展，情绪波动分析被运用在越来越多的商业场景中，例如客服人员与客户进行交谈时，双方的情绪波动情况。现有技术中，针对音频的情绪波动分析一般是通过声音的音频信号，例如语调、声波的频率和幅度变化进行分析，分析方式较为单一，并且不同人的音频信号也不相同，只用声音的音频信号对情绪进行分析准确性较低。
技术实现思路
有鉴于此，本专利技术实施例提供了一种语音情绪波动分析方法、装置、计算机设备及计算机可读存储介质，用于情绪波动进行分析准确性较低的问题。本专利技术实施例是通过下述技术方案来解决上述技术问题：一种语音情绪波动分析方法，包括：获取待测语音数据的第一音频特征和第一文字特征；基于预先训练好的音频识别模型中的音频特征提取网络，提取所述第一音频特征中的第二音频特征；基于预先训练好的文字识别模型中的文字特征提取网络，提取所述第一文字特征中的第二文字特征；识别所述第二音频特征，获取音频情绪识别结果；识别所述第二文字特征，获取文字情绪识别结果；对所述音频情绪识别结果和文字情绪识别结果进行融合处理，得到情绪识别结果，并将所述情绪识别结果发送至关联终端。进一步地，所述获取待测语音数据的第一音频特征和第一文字特征包括：对所述待测语音数据进行分帧加窗处理，获得语音分析帧；对所述语音分析帧进行傅里叶变换得到对应的频谱；将所...

【技术保护点】
1.一种语音情绪波动分析方法，其特征在于，包括：/n获取待测语音数据的第一音频特征和第一文字特征；/n基于预先训练好的音频识别模型中的音频特征提取网络，提取所述第一音频特征中的第二音频特征；基于预先训练好的文字识别模型中的文字特征提取网络，提取所述第一文字特征中的第二文字特征；/n识别所述第二音频特征，获取音频情绪识别结果；识别所述第二文字特征，获取文字情绪识别结果；/n对所述音频情绪识别结果和文字情绪识别结果进行融合处理，得到情绪识别结果，并将所述情绪识别结果发送至关联终端。/n

【技术特征摘要】
1.一种语音情绪波动分析方法，其特征在于，包括：
获取待测语音数据的第一音频特征和第一文字特征；
基于预先训练好的音频识别模型中的音频特征提取网络，提取所述第一音频特征中的第二音频特征；基于预先训练好的文字识别模型中的文字特征提取网络，提取所述第一文字特征中的第二文字特征；
识别所述第二音频特征，获取音频情绪识别结果；识别所述第二文字特征，获取文字情绪识别结果；
对所述音频情绪识别结果和文字情绪识别结果进行融合处理，得到情绪识别结果，并将所述情绪识别结果发送至关联终端。

2.根据权利要求1所述的语音情绪波动分析方法，其特征在于，所述获取待测语音数据的第一音频特征和第一文字特征包括：
对所述待测语音数据进行分帧加窗处理，获得语音分析帧；
对所述语音分析帧进行傅里叶变换得到对应的频谱；
将所述频谱经过梅尔滤波器组得到梅尔频谱；
将所述梅尔频谱进行倒谱分析，获得所述待测语音数据的第一音频特征。

3.根据权利要求2所述的语音情绪波动分析方法，其特征在于，所述识别所述第二音频特征，获取音频情绪识别结果；识别所述第二文字特征，获取文字情绪识别结果包括：
基于预先训练好的音频识别模型中的音频分类网络，识别所述第二音频特征，获取多个音频情绪分类向量对应的第一置信度；
选取第一置信度最高的音频情绪分类为目标音频情绪分类，对应的第一置信度为目标音频情绪分类参数；
对所述目标音频情绪分类向量参数进行数值映射，得到音频情绪识别结果。

4.根据权利要求1所述的语音情绪波动分析方法，其特征在于，所述获取待测语音数据的第一音频特征和第一文字特征还包括：
将所述待测语音数据转换为文字；
对所述文字进行分词处理，得到L个分词，其中L为大于0的自然数；
对所述L个分词分别进行词向量映射，以获取L个分词对应的d维词向量矩阵，其中d为大于0的自然数，所述d维词向量矩阵为待测语音数据的第一文字特征。

5.根据权利要求4所述的语音情绪波动分析方法，其特征在于，所述识别所述第二音频特征，获取音频情绪识别结果；识别所述第二文字特征，获取文字情绪识别结果包括：
基于预先训练好的文字识别模型中的文字分类网络，识别所述第二文字特征，获取多个文字情绪分类向量对应的第二置信度；

【专利技术属性】
技术研发人员：朱锦祥，单以磊，臧磊，
申请(专利权)人：深圳壹账通智能科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人