基于异常情绪语音辨识的可穿戴智能安全设备及控制方法技术

技术编号:14007899 阅读:281 留言:0更新日期:2016-11-17 06:01
本发明专利技术公开了一种基于异常情绪语音辨识的可穿戴智能安全设备及控制方法,该智能设备包括主控模块、语音采集模块、模数转换模块、通讯模块及定位模块;通过对语音信号的采集处理,完成语音特征的提取,将提取到的特征参数输入已经训练好的高斯混合模型进行模式匹配,当检测到异常情绪语音时启动定位预警功能。方法流程具体为:S1、语音信号采集;S2、语音信号预处理;S3、语音端点检测;S4、语音信号的特征提取;S5、异常情绪语音辨识阶段;S6、定位预警阶段。本发明专利技术的可穿戴智能安全设备在出现紧急情况时,通过受害者的哭闹声、尖叫、呼救声等异常情绪语音自动触发预警,以保障穿戴者的人身安全。

【技术实现步骤摘要】

本专利技术涉及可穿戴设备的研究领域,特别涉及一种基于异常情绪语音辨识的可穿戴智能安全设备及控制方法
技术介绍
现今妇女、幼儿的人身安全事故频发,引发了大众对这些弱势群体安全问题的关注。这些弱势群体在遭遇侵害时,往往由于过度紧张害怕或被束缚无法及时报警,这对案件的侦破造成了极大的阻碍,使得受害人人身安全难以得到保障。在受害人失去自行报警能力的时候,亲属只能等到失踪时间满24小时才能报警立案,然而这样的处理方式错过解救受害人的黄金时间,对受害者造成不可估量的损失。目前未发现有基于异常情绪语音辨识而自动报警的可穿戴智能安全设备。目前市面上出售的各种防止儿童走丢的智能手表具有GPS定位及手动长按键触发报警功能,报警方式不是自动的,并不智能友好。因此,人们迫切需要一款具有异常情绪语音辨识功能的可穿戴智能安全设备,在暴力犯罪案件发生时通过受害者的哭闹声、尖叫、呼救声等异常情绪语音自动触发定位预警,在暴力事件出现的第一时间向预设的终端(比如亲人的手机、110报警平台)发出预警信息(比如位置信息、现场录音),以保障佩戴者的人身安全。
技术实现思路
本专利技术的主要目的在于克服现有技术的缺点与不足,提供一种基于异常情绪语音辨识的可穿戴智能安全设备及控制方法,通过语音信号判别情绪状态,并在确认异常情绪后,通过GPRS发送报警信息的可穿戴智能安全设备,为青少年,单身女性以及老年人等弱势群体提供一个安全保障。为了达到上述目的,本专利技术采用以下技术方案:本专利技术提供了一种基于异常情绪语音辨识的可穿戴智能安全设备,包括主控模块、语音采集模块、模数转换模块、通讯模块及定位模块;其中,所述主控模块,负责情绪语音辨识的相关计算和流程控制,通过GPIO接口与模数转换模块通讯,通过串口与通讯模块及定位模块进行通讯;所述语音采集模块,用于采集佩戴者的语音信号,输入-3.3~3.3V的模拟电压信号到模数转换模块;所述模数转换模块,用于将语音采集模块输出的语音模拟信号转变为数字信号并输送到主控模块,该模数转换模块与主控模块之间采用GPIO口进行通讯;所述通讯模块,通过移动GPRS网络,实现预警信息的传输功能,将定位与现场录音信息及时传送到绑定的手机端;所述定位模块,搭载陶瓷和SMA双天线,启动时将定位信息通过TTL接口与主控模块串口进行通信。作为优选的技术方案,所述主控模块采用Exynos4412主控模块,所述语音采集模块采用SoundSensor语音采集模块,所述通讯模块采用GSM SIM900A通讯模块,所述定位模块采用ubloxGPS定位模块。作为优选的技术方案,所述通信模块与主控模块相连接,受主控模块控制,需要启动时,主控模块通过串口将启动命令和发生内容传输到通讯模块。本专利技术还提供了一种基于异常情绪语音辨识的可穿戴智能安全设备的控制方法,包括下述步骤:S1、语音信号采集,通过语音采集模块实时采集周边语音信号,该语音采集模块在正常工作状态下,将同步输出-3.3~3.3V的模拟信号,然而主控模块无法直接读取模拟信号,需要通过模数转换模块将模拟信号转换为对应的数字信号;S2、对语音信号进行预处理,主控模块对存储到缓冲区的数字语音信号首先进行短时加窗处理,帧长为25毫秒,窗口形状选择为汉明窗ω(m): ω ( m ) = 0.54 - 0.46 c o s [ 2 π m N - 1 ] 0 ≤ m ≤ N - 1 0 o t h e r s - - - ( 1 ) ]]>式(1)中m为当前采样点,N为一帧的采样点总个数;然后将主控模块缓冲区存储的语音数据与汉明窗函数相乘完成加窗操作;S3、在完成信号的加窗后,进行语音端点检测确定输入语音流的各个语音段的起点和终点;S4、语音信号的特征提取,特征一:发音速率;发音速率表示说话的快慢,采用说话时每一个字所持续的平均时间作为发音速率,即 v = x T - - - ( 2 ) ]]>式(2)中v表示发音速率,T表示语音段的持续时间,x表示语音段中的字数;当佩戴者处于异常情绪状态下时,此时的语速与平静状态时不同,有明显的语速加快的现象,语速是一个较为有效的特征;特征二:短时能量;加窗分帧处理后得到的第n帧语音信号xn(m):xn(m)=ω(m)x(n+m) 0≤m≤N-1 (3)式(3)中,n=1,2,3…;N为帧长,ω(m)为窗函数,设第n帧语音信号xn(m)的短时能量En: E n = Σ m = 0 N - 1 x n 2 ( m ) - - - ( 4 ) ]]>特征三:短时过零率;短时过零率表示在单位时间内语音信号由正到负或由负到正变化的次数,符号函数如下所示: sgn [ x ] = 本文档来自技高网...
基于异常情绪语音辨识的可穿戴智能安全设备及控制方法

【技术保护点】
一种基于异常情绪语音辨识的可穿戴智能安全设备,其特征在于,包括主控模块、语音采集模块、模数转换模块、通讯模块及定位模块;其中,所述主控模块,负责情绪语音辨识的相关计算和流程控制的功能,通过GPIO接口与模数转换模块通讯,通过串口与通讯模块及定位模块进行通讯;所述语音采集模块,用于采集佩戴者的语音信号,输入‑3.3~3.3V的模拟电压信号到模数转换模块;所述模数转换模块,用于将语音采集模块输出的语音模拟信号转变为数字信号并输送到主控模块,该模数转换模块与主控模块之间采用GPIO口进行通讯;所述通讯模块,通过移动GPRS网络,实现预警信息的传输功能,将定位与现场录音信息及时传送到绑定的手机端;所述定位模块,搭载陶瓷和SMA双天线,启动时将定位信息通过TTL接口与主控模块串口进行通信。

【技术特征摘要】
1.一种基于异常情绪语音辨识的可穿戴智能安全设备,其特征在于,包括主控模块、语音采集模块、模数转换模块、通讯模块及定位模块;其中,所述主控模块,负责情绪语音辨识的相关计算和流程控制的功能,通过GPIO接口与模数转换模块通讯,通过串口与通讯模块及定位模块进行通讯;所述语音采集模块,用于采集佩戴者的语音信号,输入-3.3~3.3V的模拟电压信号到模数转换模块;所述模数转换模块,用于将语音采集模块输出的语音模拟信号转变为数字信号并输送到主控模块,该模数转换模块与主控模块之间采用GPIO口进行通讯;所述通讯模块,通过移动GPRS网络,实现预警信息的传输功能,将定位与现场录音信息及时传送到绑定的手机端;所述定位模块,搭载陶瓷和SMA双天线,启动时将定位信息通过TTL接口与主控模块串口进行通信。2.根据权利要求1所述基于异常情绪语音辨识的可穿戴智能安全设备,其特征在于,所述主控模块采用Exynos4412主控模块,所述语音采集模块采用SoundSensor语音采集模块,所述通讯模块采用GSM SIM900A通讯模块,所述定位模块采用ubloxGPS定位模块。3.根据权利要求1所述基于异常情绪语音辨识的可穿戴智能安全设备,其特征在于,所述通信模块与主控模块相连接,受主控模块控制,需要启动时,主控模块通过串口将启动命令和发生内容传输到通讯模块。4.一种基于异常情绪语音辨识的可穿戴智能安全设备的控制方法,其特征在于,包括下述步骤:S1、语音信号采集,通过语音采集模块实时采集周边语音信号,该语音采集模块在正常工作状态下,将同步输出-3.3~3.3V的模拟信号,然而主控模块无法直接读取模拟信号,需要通过模数转换模块将模拟信号转换为对应的数字信号;S2、对语音信号进行预处理,主控模块对存储到缓冲区的数字语音信号首先进行短时加窗处理,帧长为25毫秒,窗口形状选择为汉明窗ω(m): ω ( m ) = 0.54 - 0.46 c o s [ 2 π m N - 1 ] 0 ≤ m ≤ N - 1 0 o t h e r s - - - ( 1 ) ]]>式(1)中m为当前采样点,N为一帧的采样点总个数;然后将主控模块缓冲区存储的语音数据与汉明窗函数相乘完成加窗操作;S3、在完成信号的加窗后,进行语音端点检测确定输入语音流的各个语音段的起点和终点;S4、语音信号的特征提取,特征一:发音速率;发音速率表示说话的快慢,采用说话时每一个字所持续的平均时间作为发音速率,即 v = x T - - - ( 2 ) ]]>式(2)中v表示发音速率,T表示语音段的持续时间,x表示语音段中的字数;当佩戴者处于异常情绪状态时,此时的语速与平静状态时不同,有明显语速加快的现象,语速是一个较为有效的特征;特征二:短时能量;加窗分帧处理后得到的第n帧语音信号xn(m):xn(m)=ω(m)x(n+m) 0≤m≤N-1 (3)式(3)中,n=1,2,3…;N为帧长,ω(m)为窗函数,设第n帧语音信号xn(m)的短时能量En: E n = Σ m = 0 N - 1 x n 2 ( m ) - - - ( 4 ) ]]>特征三:短时过零率;短时过零率表示在单位时间内语音信号由正到负或由负到正变化的次数,符号函数如下所示: s g n [ x ] = 1 x ≥ 0 - 1 x < 0 - - - ( 5 ) ]]>则计算语音信号短时过率的公式如下: Z n = Σ m = 0 N - 1 | s g n [ x n ( m ) ] - s g n [ x n ( m - 1 ) ] + δ | - - - ( 6 ) ]]>式(6)中δ为设定的门限值,使得对于干扰信号具有一定的鲁棒性;特征四:基音频率;对于语音信号xn(m)定义其自相关函数Rn(k)为: R n ( k ) = Σ m = 0 N - k - 1 x n ( m ) x n ( m + k ) - - - ( 7 ) ]]>式(7)中N表示帧长,Rn(k)不为零的范围为k=(-N+1)~(N-1),且为偶函数,浊音信号的自相关函数在基音周期的整数倍位置上出现峰值;检测峰值的位置就可以提取基音周期值;S5、情绪语音辨识阶段,将语速、短时平均能量、短时过零率和基音频率作为异常情绪语音辨识的特征参数,确定该段语音信号是否属于异常情绪语音信号;S6、定位预警阶段,主控模块通过串口向定位模块下达启动命令,定位模块获取GPS定位信息,将定位信息通过串口传回主控模块缓冲区;主控模块在接收到定位模块传回的完整定位信息后,将控制命令和需发送的定位信息发送至通讯模块缓冲区,当缓冲区收到完整的定位信息后,通过GPRS网络将定位信息发送至绑定手机端,完成预警工作。5.根据权利要求4所述基于异常情绪语音辨识的可穿戴智能安全设备的控制方法,其特征在于,步骤S1中,通过模数转换模块将模拟信号转换为对应的数字信号的具体方法为:根据CCITT提出的G711标准,选取8KHz采样率、16bit量化,并将转换后的数字信号通过GPIO口读取到主控模块的缓冲区。6.根据权利要求4所述基于异常情绪语音辨识的可穿戴智能安全设备的控制方法,其特征在于,公式(1)中,采样频率选为8KHz,帧长为25毫秒,因此N=200。7.根据权利要求4所述基于异常情绪语音辨识的可穿戴智能安全设备的控制方法,其特征在于,步骤S3中,通过平均短时过零率和短时能量实现确定输入语音流的各个语音段的起点和终点,其具体方法为:将整个语音信号的端点分为四段:静音、过渡段、语音段、结束,程序中使用一个变量status来表示所处的状态,在静音段,如果能量或过零率超越了低门限,就开始标记起始点,并进入过渡段,在过渡段中,由于参数的数值比较小,不能确定是否处于真正的语音段,因此只要两个参数都回到低门限以下,就确定当前状态恢复到了静音状态,当过渡段中检测到能量和过零率高于门限值时,则表明已进入语音段;当在语音段中能量和过零率再次...

【专利技术属性】
技术研发人员:杨超李艳雄黄耀雄
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1