【技术实现步骤摘要】
一种基于智能人机交互的操作控制系统
本专利技术属于语音控制
,具体涉及一种基于智能人机交互的操作控制系统。
技术介绍
智能人机交互操作控制正作为一种新型的沟通平台逐渐走进军用设备研制应用中,人机交互的智能化在一定程度上决定了人机交互的多样性,同样也是关键环节之一。随着机器学习、人工智能等技术的发展,语音识别控制技术也得到了极大的发展,语音识别技术的渐渐成熟,性能及稳定性的发展,使之可以越来越广泛的应用在设备研制中。生物识别领域中包括多种生物性特征,为了满足社会需要,研究一种迅速、有效、稳定的生物识别技术在当今网络技术普及率极高的情况下,显得尤其必要。声纹识别便在这种情况下应运而生,语言是人类所具有的自然属性之一,是人类进行相互通信和交流的最方便快捷的一种手段,每个人说话都具有各自的生物特征,同其他传统的生物识别技术相比,使用说话人语音对说话人的身份进行识别具有更加简便、准确、经济及可扩展性良好等各种优势。
技术实现思路
(一)要解决的技术问题本专利技术要解决的技术问题是:如何设计一种基于智能人机交互的操作控制系统,使得设备上的人机交互更加智能、便捷、准确。(二)技术方案为了解决上述技术问题,本专利技术提供了一种基于智能人机交互的操作控制系统,包括:语音信息拾取模块、语音信息预处理模块、语音信息特征提取模块、身份认证模块、语音识别控制模块;所述语音信息拾取模块用于采用麦克风阵列采集用户的语音信号;所述语音信息预处理模块,用于对语音信息拾取模块输出 ...
【技术保护点】
1.一种基于智能人机交互的操作控制系统,其特征在于,包括:语音信息拾取模块、语音信息预处理模块、语音信息特征提取模块、身份认证模块、语音识别控制模块;/n所述语音信息拾取模块用于采用麦克风阵列采集用户的语音信号;/n所述语音信息预处理模块,用于对语音信息拾取模块输出的语音信号依次进行预加重处理、分帧加窗处理;/n所述语音信息特征提取模块,用于对语音信息预处理后的信号提取语音信息的梅尔倒谱系数MFCC特征;/n所述身份认证模块,用于将语音信息特征提取模块提取出语音信息的特征与已建立的用户语音特征库进行比对,通过计算特征值之间的最小距离,得到用户的身份信息,判断用户是否为合法用户及拥有的权限;/n所述语音识别控制模块,用于采用DTW技术计算出采集的语音与短语库中短语的最小距离,即将输入的语音转换为文本,根据文本信息进行相应的操作控制。/n
【技术特征摘要】
1.一种基于智能人机交互的操作控制系统,其特征在于,包括:语音信息拾取模块、语音信息预处理模块、语音信息特征提取模块、身份认证模块、语音识别控制模块;
所述语音信息拾取模块用于采用麦克风阵列采集用户的语音信号;
所述语音信息预处理模块,用于对语音信息拾取模块输出的语音信号依次进行预加重处理、分帧加窗处理;
所述语音信息特征提取模块,用于对语音信息预处理后的信号提取语音信息的梅尔倒谱系数MFCC特征;
所述身份认证模块,用于将语音信息特征提取模块提取出语音信息的特征与已建立的用户语音特征库进行比对,通过计算特征值之间的最小距离,得到用户的身份信息,判断用户是否为合法用户及拥有的权限;
所述语音识别控制模块,用于采用DTW技术计算出采集的语音与短语库中短语的最小距离,即将输入的语音转换为文本,根据文本信息进行相应的操作控制。
2.如权利要求1所述的系统,其特征在于,所述语音信息拾取模块具体用于通过声波抵达麦克风阵列中每个麦克风之间的微小时差的相互作用,使用阵列算法处理后的指向性波束形成技术来形成一个锥状窄波束,只接收说话人的声音,同时抑制环境中的噪声与干扰。
3.如权利要求1所述的系统,其特征在于,所述语音信息预处理模块在预加重处理时具体是将语音信号S(n)中高频部分的频谱进行提升处理,以抑制语音信号的低频干扰。
4.如权利要求3所述的系统,其特征在于,所述语音信息预处理模块在预加重处理的实现方式具体是利用一阶的FIR高通滤波器对语音信号进行预加重,FIR高通滤波器的传递函数为H(z)=1-αz-1,其中α表示FIR高通滤波器的预加重系数,0.9<α<1.0。
5.如权利要求4所述的系统,其特征在于,所述语音信息预处理模块在分帧加窗处理时,其中的分帧是指以20毫秒为帧,1/2的时间作为帧移位帧,其中的帧移位是指相邻两帧之间的重叠区域。
6.如权利要求5所述的系统,其特征在于,所述语音信息预处理模块在分帧加窗处理时,分帧加窗处理中的加窗是在分帧之后,通过一个有限长度的窗口在语音信号上进行滑动加权,使成帧后的信号变得连续,具体的计算...
【专利技术属性】
技术研发人员:侯祖贵,杨舸,卢秋实,赵鑫,
申请(专利权)人:北京计算机技术及应用研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。