【技术实现步骤摘要】
基于声音特征识别的语言冲突监测方法、介质及设备
本专利技术涉及语音监测
,特别涉及一种基于声音特征识别的语言冲突监测方法、一种计算机可读存储介质以及一种计算机设备。
技术介绍
在现实生活中,尤其对于服务行业而言,服务人员与客户之间发生语言冲突的事件时有发生,而如果管理人员对类似的语言冲突不加以及时制止的话;往往容易导致吵架甚至打架事件的发生,造成严重的后果。相关技术中,多采用先将语音转换为文本,然后提取和识别文本是否存在不文明关键词的形式来判断语言冲突;然而,这种方式对于语言冲突的识别准确率低,并且,识别效率低下,难以有效制止冲突事件的发生。
技术实现思路
本专利技术旨在至少在一定程度上解决上述技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种基于声音特征识别的语言冲突监测方法,能够实现对语言冲突的准确识别,并且,识别效率高,进而防止冲突事件的发生。本专利技术的第二个目的在于提出一种计算机可读存储介质。本专利技术的第三个目的在于提出一种计算机设备。为达到上述目的,本 ...
【技术保护点】
1.一种基于声音特征识别的语言冲突监测方法,其特征在于,包括以下步骤:/n获取多个历史语音数据,并对每个历史语音数据进行特征提取,以提取每个历史语音数据对应的第一声音特征参数,以及根据所述第一声音特征参数生成第一声音特征向量;/n将所述第一声音特征向量输入到支持向量机中进行模型的训练,以训练得到语言冲突识别模型;/n获取待检测语音数据,并对所述待检测语音数据进行预处理,以生成对应的短帧声音信号,以及根据基于共振峰的语音端点检测算法对所述短帧声音信号进行端点检测,以提取所述短帧声音信号中的人声语音信号;/n对所述人声语音信号进行特征提取,以提取所述人声语音信号对应的第二声音特 ...
【技术特征摘要】
1.一种基于声音特征识别的语言冲突监测方法,其特征在于,包括以下步骤:
获取多个历史语音数据,并对每个历史语音数据进行特征提取,以提取每个历史语音数据对应的第一声音特征参数,以及根据所述第一声音特征参数生成第一声音特征向量;
将所述第一声音特征向量输入到支持向量机中进行模型的训练,以训练得到语言冲突识别模型;
获取待检测语音数据,并对所述待检测语音数据进行预处理,以生成对应的短帧声音信号,以及根据基于共振峰的语音端点检测算法对所述短帧声音信号进行端点检测,以提取所述短帧声音信号中的人声语音信号;
对所述人声语音信号进行特征提取,以提取所述人声语音信号对应的第二声音特征参数,并根据所述第二声音特征参数生成第二声音特征向量;
将所述第二声音特征向量输入到所述语言冲突识别模型中,以通过所述语言冲突识别模型判断所述待检测语音数据是否存在语言冲突。
2.如权利要求1所述的基于声音特征识别的语言冲突监测方法,其特征在于,所述第一声音特征参数包括:共振峰特征向量、短时平均能量特征和梅尔倒谱系数特征向量。
3.如权利要求1所述的基于声音特征识别的语言冲突监测方法,其特征在于,对所述待检测语音数据进行预处理,以生成对应的短帧声音信号,包括:
通过防混叠的模拟带通滤波器对所述待检测语音数据进行滤波,以生成模拟声音信号,并对所述模拟声音信号进行采样,以得到离散的时域声音信号;
通过一阶FIR数字高通滤波器对所述时域声音信号进行提升,并对提升后的时域声音信号进行交叠分帧,以生成对应的短帧声音信号。
4.如权利要求1所述的基于声音特征识别的语言冲突监测方法,其特征在于,根据基于共振峰的语音端点检测算法对所述短帧声音信号进行端点检测,以提取所述短帧声音信号中的人声语音信号,包括:
获取所述短帧声音信号对应的频谱,并根据所述频谱中每个元音对应的频点所具有的平均能量值计算与其相隔半个共振峰频率跨度的两个相邻频点所具有平均能量值的差,以获取峰邻平均能量差;
对所述峰邻平均能量差进行加权求和,以得到每个元音对应的PND值,并根据每个元音对应的PND值获取所述短帧声音信号中的最大PND值,以及根据多个短帧声音信号对应的最大PND值确定信号阈值;
根据每个短帧声音信号对应的最大PND值和所述信号阈值判断该短帧声音信号中是否包含人声语音信号。
5.如权利要求4所述的基于声音特征识别的语言冲突监测方法,其特征在于,所述峰邻平均能量差、PND值、最大PND值和信号阈值根据以下公式计算:
其中,PND1,1(i)表示第一个元音的峰邻平均能量差,fmt1,1表示第一个元音的第一个共振峰频率,fmtL表示每个共振峰所跨越的最大频率范围;
其中,PNDm(i)表示PND值,...
【专利技术属性】
技术研发人员:朱逸,黄晶晶,袁飞,程恩,
申请(专利权)人:厦门大学,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。