【技术实现步骤摘要】
语音数据情感检测方法、装置、电子设备和存储介质
[0001]本专利技术涉及自然语言处理
,尤其涉及一种语音数据情感检测方法、装置、电子设备和存储介质。
技术介绍
[0002]语音数据情感检测就是对原始的音频信息进行分析得到该段音频中说话人所表达的感情信息。语音记录了说话者完整的声音信息,它包含了说话人的语言内容、语音语调等信息。说话人往往是通过说话的内容和语音语调共同作用来表达出内心的感情的,因此相比于通过文字进行感情分析,使用语音进行感情分析更有优势。
[0003]在生活中,长时连续的对话语音十分常见,比如客服热线、心理援助热线等服务、救助场景,通过对长对话语音感情分析获得的来电者的感情变化,并最终得到一个整体评价。目前对长时连续对话的感情分析的主要方法是对每句对话进行感情分类,然而心理感情的表达是一个时序过程,是需要多句话按时间顺序依次表达得出的一个累计结果,而判断这个感情所需要的话语数量往往是难以确定的,因此该方法由于没有考虑每种感情产生的起止位置,忽略了感情表达的过程性和阶段性,从而无法准确进行情感检测 ...
【技术保护点】
【技术特征摘要】
1.一种语音数据情感检测方法,其特征在于,包括:确定待检测的语音数据,所述语音数据包括至少一个完整语句;将所述语音数据输入至情感检测模型,得到所述情感检测模型输出的情感检测结果;其中,所述情感检测模型是基于包含至少一个完整语句的样本语音数据及其对应的样本情感检测结果训练得到的;所述情感检测模型用于在提取所述语音数据的语音特征后,将所述语音特征划分为多个候选感情区域特征,并基于非极大抑制从多个候选感情区域特征中确定目标感情区域特征,以及对各目标感情区域特征进行情感分类,得到所述情感检测结果;各候选感情区域特征对应的语音数据为一个或多个完整语句。2.根据权利要求1所述的语音数据情感检测方法,其特征在于,所述将所述语音数据输入至情感检测模型,得到所述情感检测模型输出的情感检测结果,包括:将所述语音数据输入至所述情感检测模型的特征提取层,得到所述特征提取层输出的所述语音数据的语音特征;将所述语音特征输入至所述情感检测模型的候选区域检测层,得到所述候选区域检测层输出的所述多个候选感情区域特征;将所述多个候选感情区域特征输入至所述情感检测模型的目标区域检测层,由所述目标区域检测层对所述多个候选感情区域特征进行非极大抑制处理,得到所述目标区域检测层输出的所述目标感情区域特征;将所述目标感情区域特征输入至所述情感检测模型的情感分类层,得到所述情感分类层输出的所述情感检测结果。3.根据权利要求2所述的语音数据情感检测方法,其特征在于,所述将所述语音数据输入至所述情感检测模型的特征提取层,得到所述特征提取层输出的所述语音数据的语音特征,包括:将所述语音数据输入至所述特征提取层的声谱图转换层,得到所述声谱图转换层输出的所述语音数据对应的声谱图;将所述声谱图输入至所述特征提取层的上采样层,由所述上采样层对所述声谱图进行上采样,得到所述上采样层输出的高维特征;将所述高维特征输入至所述特征提取层的上下文融合层,由所述上下文融合层对所述高维特征进行上下文信息融合,得到所述上下文融合层输出的所述语音数据的语音特征。4.根据权利要求3所述的语音数据情感检测方法,其特征在于,所述将所述语音数据输入至所述特征提取层的声谱图转换层,得到所述声谱图转换层输出的所述语音数据对应的声谱图,包括:将所述语音数据输入至所述特征提取层的声谱图转换层,由所述声谱图转换层依次对所述语音数据进行分帧处理、加窗处理以及傅里叶变换,得到所述声谱图转换层输出的所述语音数据对应的声谱图。5.根据权利要求2至4任一项所述的语音数据...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。