一种语音语义分析方法技术

技术编号:36067437 阅读:70 留言:0更新日期:2022-12-24 10:34
本发明专利技术涉及人工智能技术,揭露了一种语音语义分析方法,包括:对通话录音进行纠偏以及滤波操作,得到标准语音;对标准语音进行分帧处理以及端点检测,得到语音帧序列;对语音帧序列进行多重特征提取操作,得到第一特征序列和第二特征序列;利用训练后的语境分析模型对第一特征序列进行情感分析,得到情感信息;利用预设的自注意力模型对第二特征序列进行音素分析,得到第二特征序列所对应的音素序列;通过预设的音素识别模型对音素序列进行解码操作,得到文本信息;根据情感信息和文本信息生成通话录音的录音语义。本发明专利技术可以提高语音语义分析的准确度。语义分析的准确度。语义分析的准确度。

【技术实现步骤摘要】
一种语音语义分析方法


[0001]本专利技术涉及人工智能
,尤其涉及一种语音语义分析方法。

技术介绍

[0002]随着人工智能技术的发展,越来越多的机构开始利用智能语音客服来分散人工客服在高峰期的接线量,减轻人工客服的工作负担,但为了给用户更好的通话体验,提高智能语音客服的服务质量,需要对用户的通话语音进行语义分析。
[0003]现有的语音语义分析技术多为基于单一的语音特征的语义分析,例如,计算语音特征与词典中词语语音特征的匹配度,进而选取匹配度最大的词语作为生成语音语义文本,实际应用中,一个语音特征可以对应多种文本,且同样的文本可以反映多种情绪状态,仅考虑单一属性,可能导致语音语义分析结果较为模糊,进而使得进行语音语义分析时的准确度较低。

技术实现思路

[0004]本专利技术提供一种语音语义分析方法,其主要目的在于解决进行语音语义分析时的准确度较低的问题。
[0005]为实现上述目的,本专利技术提供的一种语音语义分析方法,包括:
[0006]获取待分析的通话录音,对所述通话录音进行纠偏以及滤波操作本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音语义分析方法,其特征在于,所述方法包括:获取待分析的通话录音,对所述通话录音进行纠偏以及滤波操作,得到标准语音;对所述标准语音进行分帧处理以及端点检测,得到语音帧序列;对所述语音帧序列进行多重特征提取操作,得到所述语音帧序列所对应的第一特征序列和第二特征序列;利用训练后的语境分析模型对所述第一特征序列进行情感分析,得到所述语音帧序列所对应的情感信息;利用预设的自注意力模型对所述第二特征序列进行音素分析,得到所述第二特征序列所对应的音素序列;通过预设的音素识别模型对所述音素序列进行解码操作,得到所述语音帧序列所对应的文本信息;根据所述情感信息和所述文本信息生成所述通话录音的录音语义。2.如权利要求1所述的语音语义分析方法,其特征在于,所述对所述通话录音进行纠偏以及滤波操作,得到标准语音,包括:将所述通话录音转化为列信号数据,根据所述列信号数据以及预设的采样频率配置所述通话录音的时间序列;根据所述时间序列以及所述列信号数据构建所述通话录音的趋势项,并从所述列信号数据中去除所述趋势项,得到纠偏后的初始语音;利用预设的滤波器消除所述初始语音中的干扰波段频率,得到标准语音。3.如权利要求1所述的语音语义分析方法,其特征在于,所述对所述标准语音进行分帧处理以及端点检测,得到语音帧序列,包括:配置分帧的帧移步长、重叠长度、窗口长度以及窗口类型;根据所述帧移步长与所述重叠长度逐帧对所述标准语音进行切分,得到初始语音序列;根据所述窗口长度以及所述窗口类型对所述初始语音序列进行加窗处理,得到标准语音序列;计算所述标准语音序列的短时平均能量与短时平均过零率,根据所述短时平均能量与所述短时平均过零率对所述标准语音序列进行端点检测,得到语音帧序列。4.如权利要求1所述的语音语义分析方法,其特征在于,所述对所述语音帧序列进行多重特征提取操作,得到所述语音帧...

【专利技术属性】
技术研发人员:吴石松何超林张伟董召杰徐长飞谢型浪
申请(专利权)人:南方电网数字电网研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1