一种应用于人机交互中的远近场拾音方法技术

技术编号:34126650 阅读:21 留言:0更新日期:2022-07-14 14:22
一种应用于人机交互中的远近场拾音方法,包括如下步骤:通过近场麦克风全向拾取近场声音信号生成近场声音数据、通过远场麦克风全向拾取远场声音信号生成远场声音数据;噪音分析单元对近场声音数据和/或远场声音数据接收,采用预设特征库内的声音特性进行滤除,生成去噪声音数据;预处理单元对去噪声音数据接收,并进行预处理,生成预处理声音数据;主处理单元对预处理声音数据进行语音识别,生成指令数据;输出单元对指令数据进行输出至终端。本发明专利技术可以使语音指令输入不受距离影响,提高指令输入的稳定性;同时,降低环境噪音对指令输入的影响,提高指令输入的准确性,保证指令操作的正常执行。的正常执行。的正常执行。

【技术实现步骤摘要】
一种应用于人机交互中的远近场拾音方法


[0001]本专利技术涉及人机交互
,尤其涉及一种应用于人机交互中的远近场拾音方法。

技术介绍

[0002]随着社会的进步和技术的发展,手机设备、免提设备以及头戴设备等通讯产品在日常生活和专利领域中扮演的角色愈来愈重要,人机交互行为也越来越普遍,人们可通过语音控制来执行相应的功能;比如,受控设备检测到语音控制指令时,可以根据检测到的语音控制指令来执行相应的操作。
[0003]在使用语音识别技术进行语音控制中,声音输入容易受距离远近和噪音干扰的影响,导致无法及时做出指令操作,来执行相应操作,影响人们的正常使用。

技术实现思路

[0004]有鉴于此,本专利技术所要解决的技术问题是:提供一种应用于人机交互中的远近场拾音方法,使语音指令输入不受距离影响,提高指令输入的稳定性;同时,降低环境噪音对指令输入的影响,提高指令输入的准确性,保证指令操作的正常执行。
[0005]为解决上述技术问题,本专利技术的技术方案是:
[0006]一种应用于人机交互中的远近场拾音方法,其特征在于,包括如下步骤:
[0007]S1、通过近场麦克风全向拾取近场声音信号生成近场声音数据、通过远场麦克风全向拾取远场声音信号生成远场声音数据;
[0008]S2、噪音分析单元对所述近场声音数据和/或所述远场声音数据接收,采用预设特征库内的声音特性进行滤除,生成去噪声音数据;
[0009]S3、预处理单元对所述去噪声音数据接收,并进行预处理,生成预处理声音数据;
[0010]S4、主处理单元对所述预处理声音数据进行语音识别,生成指令数据;
[0011]S5、输出单元对指令数据进行输出至终端。
[0012]优选的,所述预设特征库内的声音特性包括时间特性、波形特性、频谱特性。
[0013]优选的,若S2中采用时间特性作为所述声音特性进行滤除条件,则包括如下步骤:
[0014]S21、判断所述近场声音数据和/或所述远场声音数据的时间长度是否满足进行滤除操作的预设时间长度,若不满足,则作为噪音滤除;
[0015]若满足,则生成所述去噪声音数据。
[0016]优选的,若S2中采用波形特性作为所述声音特性进行滤除条件,则包括如下步骤:
[0017]S22、判断所述近场声音数据和/或所述远场声音数据的波形振幅是否满足进行滤除操作的预设波形特征,若不满足,则作为噪音滤除;
[0018]若满足,则生成所述去噪声音数据。
[0019]优选的,判断所述波形振幅是否满足进行滤除操作的预设波形特征,包括如下步骤:
[0020]S221、采集所述近场声音数据和/或所述远场声音数据中位于0~2秒内的短波形振幅,判断是否满足进行滤除操作的预设波形特征,若不满足,则作为噪音滤除;
[0021]若满足,则进行S222步骤,包括:
[0022]S222、采集所述近场声音数据和/或所述远场声音数据中位于3~6秒内的长波形振幅,判断是否满足进行滤除操作的预设波形特征,若不满足,则作为噪音滤除;
[0023]若满足,则生成所述去噪声音数据。
[0024]优选的,若S2中采用频谱特性作为所述声音特性进行滤除条件,则包括如下步骤:
[0025]S23、判断所述近场声音数据和/或所述远场声音数据的频谱强度是否满足进行滤除操作的预设频谱特征,若不满足,则作为噪音滤除;
[0026]若满足,则生成所述去噪声音数据。
[0027]优选的,所述S3中还包括:
[0028]增益单元,所述预处理单元对所述去噪声音数据进行预处理后并经所述增益单元进行增益,生成所述预处理声音数据。
[0029]优选的,所述S5中还包括:
[0030]通信单元,所述输出单元与通信单元连接,通过所述通信单元将所述指令数据进行压缩后发送至所述终端。
[0031]采用了上述技术方案后,本专利技术的有益效果是:
[0032]本专利技术中,公开了应用于人机交互中的远近场拾音方法,包括:S1、通过近场麦克风、远场麦克风全向拾取近场声音信号、远场声音信号,生成近场声音数据、远场声音数据;S2、噪音分析单元进行滤除,生成去噪声音数据;S3、预处理单元生成预处理声音数据;S4、主处理单元生成指令数据;S5、输出单元输出至终端。本专利技术中,采用近场麦克风、远场麦克风对语音指令进行分别拾取,使语音指令输入不受距离影响,针对远端语音指令,能够及时接收,防止发生指令丢失情况,提高指令输入的稳定性;同时,通过噪音分析单元进行滤除,滤除语音指令中的环境噪音数据,降低环境噪音对指令输入的影响,提高指令输入的准确性,保证指令操作的正常执行。
附图说明
[0033]下面结合附图和实施例对本专利技术进一步说明。
[0034]图1是本专利技术实施例的流程图。
具体实施方式
[0035]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0036]如图1所示,本专利技术包括如下步骤:
[0037]S1、通过近场麦克风全向拾取近场声音信号生成近场声音数据、通过远场麦克风全向拾取远场声音信号生成远场声音数据;
[0038]S2、噪音分析单元对近场声音数据和/或远场声音数据接收,采用预设特征库内的声音特性进行滤除,生成去噪声音数据;
[0039]S3、预处理单元对去噪声音数据接收,并进行预处理,生成预处理声音数据;
[0040]S4、主处理单元对预处理声音数据进行语音识别,生成指令数据;
[0041]S5、输出单元对指令数据进行输出至终端。
[0042]本专利技术中,采用近场麦克风、远场麦克风对语音指令进行分别拾取,使语音指令输入不受距离影响,针对远端语音指令,能够及时接收,防止发生指令丢失情况,提高指令输入的稳定性;同时,通过噪音分析单元进行滤除,滤除语音指令中的环境噪音数据,降低环境噪音对指令输入的影响,提高指令输入的准确性,保证指令操作的正常执行。
[0043]其中,噪音分析单元对近场声音数据和/或远场声音数据进行全程接收,并采用预设特征库内的声音特性进行滤除。
[0044]预设特征库内的声音特性包括时间特性、波形特性、频谱特性。
[0045]其中,若S2中采用时间特性作为声音特性进行滤除条件,则包括如下步骤:
[0046]S21、判断近场声音数据和/或远场声音数据的时间长度是否满足进行滤除操作的预设时间长度,若不满足,则作为噪音滤除;
[0047]若满足,则生成去噪声音数据。
[0048]预设时间为0~2秒,针对近场声音数据和/或远场声音数据包含的瞬时声音,其拾音数据作为噪音,进行滤除。
[0049]若S2中采用波形特性作为声音特性进行滤除条件,则包括如下步骤:
[0050]S22、判断本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种应用于人机交互中的远近场拾音方法,其特征在于,包括如下步骤:S1、通过近场麦克风全向拾取近场声音信号生成近场声音数据、通过远场麦克风全向拾取远场声音信号生成远场声音数据;S2、噪音分析单元对所述近场声音数据和/或所述远场声音数据接收,采用预设特征库内的声音特性进行滤除,生成去噪声音数据;S3、预处理单元对所述去噪声音数据接收,并进行预处理,生成预处理声音数据;S4、主处理单元对所述预处理声音数据进行语音识别,生成指令数据;S5、输出单元对指令数据进行输出至终端。2.如权利要求1所述的应用于人机交互中的远近场拾音方法,其特征在于,所述预设特征库内的声音特性包括时间特性、波形特性、频谱特性。3.如权利要求2所述的应用于人机交互中的远近场拾音方法,其特征在于,若S2中采用时间特性作为所述声音特性进行滤除条件,则包括如下步骤:S21、判断所述近场声音数据和/或所述远场声音数据的时间长度是否满足进行滤除操作的预设时间长度,若不满足,则作为噪音滤除;若满足,则生成所述去噪声音数据。4.如权利要求2所述的应用于人机交互中的远近场拾音方法,其特征在于,若S2中采用波形特性作为所述声音特性进行滤除条件,则包括如下步骤:S22、判断所述近场声音数据和/或所述远场声音数据的波形振幅是否满足进行滤除操作的预设波形特征,若不满足,则作为噪音滤除;若满足,则生成所述去噪声音数据。5...

【专利技术属性】
技术研发人员:严小天刘文彪刘鲁峰刘琳
申请(专利权)人:青岛虚拟现实研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1