一种基于语音降噪的声控方法及装置制造方法及图纸

技术编号:39718476 阅读:7 留言:0更新日期:2023-12-17 23:25
一种基于语音降噪的声控方法及装置,涉及语音识别领域

【技术实现步骤摘要】
一种基于语音降噪的声控方法及装置


[0001]本申请涉及语音识别
,具体涉及一种基于语音降噪的声控方法及装置


技术介绍

[0002]随着智能家居

智能助理等智能设备的普及,语音交互成为人机交互的重要方式之一

通过语音识别技术将语音转换为文本,并通过控制指令实现对设备的远程控制,可以提高用户的使用便捷性和体验

[0003]传统技术在语音识别和控制方面存在一些劣势

传统的语音识别技术采用单麦克风采集的方式,此种方式容易受到环境噪声和回音的干扰,在多人说话的情况以及复杂环境下的语音识别,传统的语音识别方式的识别准确度不高

[0004]因此,亟需一种基于语音降噪的声控方法及装置


技术实现思路

[0005]本申请提供了一种基于语音降噪的声控方法及装置,解决了传统的语音识别方式的识别准确度不高的问题

[0006]本申请第一方面提供了一种基于语音降噪的声控方法,该方法包括:获取麦克风阵列采集的语音,所述麦克风阵列包括多个麦克风;根据多个所述麦克风各自接收到所述语音的时间点,确定目标语音的方向;基于所述目标语音的方向,对所述目标语音以外的干扰语音进行杂音降噪,得到降噪后的目标语音;将所述目标语音转换为控制指令,以便于通过所述控制指令控制所述终端设备运行

[0007]通过上述技术方案,提高目标语音的清晰度和可辨识度,减少干扰对于目标语音的影响

将目标语音转换为文本,可以实现语音识别的功能

通过将文本用于控制目标设备的运行,可以实现语音交互和智能控制的应用

[0008]可选地,基于目标语音的方向,对目标语音以外的干扰语音进行杂音降噪,得到降噪后的目标语音,具体包括:将采集到的语音与预先构建的噪音模型进行相似度计算,语音包括目标语音和干扰语音;噪音模型包括多种类型的噪音;从语音中去除干扰噪音,得到降噪后的目标噪音;其中,干扰噪音为语音中与噪音模型相似度大于相似度阈值的噪音

[0009]通过采用上述技术方案,对干扰语音进行建模,得到噪声模型

该噪声模型包括干扰语音的频谱特性,用于描述干扰语音的声音特征和频率分布

通过建模可以更好地理解和分析干扰语音的特性,为后续的降噪算法提供基础

将采集到的语音与噪声模型进行比较,通过降噪算法去除干扰语音,得到目标语音

降噪算法可以根据噪声模型的信息,对输入的语音信号进行处理和修复,去除干扰信号的影响,从而提高目标语音的清晰度和可辨识度

通过干扰语音的建模和降噪算法的应用,上述技术方案可以实现对干扰语音的抑制和目标语音的增强,从而提高语音信号的质量和准确性

这种技术方案在语音处理和通信系统中具有重要的应用价值,可以提升语音通信的效果和用户体验

[0010]可选地,根据多个所述麦克风各自接收到所述语音的时间点,确定目标语音的方
向,具体包括:对多个所述麦克风采集到的目标语音进行滤波操作;选取多个所述麦克风中任意一个麦克风作为第一麦克风,选取多个所述麦克风中除所述第一麦克风以外的任意一个麦克风作为第二麦克风;将所述第二麦克风采集的目标语音与所述第一麦克风采集的目标语音进行交叉相关运算,得到时延差;根据所述时延差,确定所述目标语音的方向

[0011]通过采用上述技术方案,通过滤波操作可以提取出麦克风接收到的语音中的目标信号,减少背景噪声和干扰信号的影响

选取一个麦克风作为第一麦克风,选取另一个麦克风作为第二麦克风

将第一麦克风采集的目标语音和第二麦克风采集的目标语音进行交叉相关运算,得到时延差

通过计算时延差可以确定目标语音的方向

[0012]可选地,时延差的计算公式具体为:
T

argmax[∫x1(t)x2(t

t0)dt];其中,
t
为时间,
x1(t)
为所述第一麦克风采集的目标语音,
x2(t

t0)
为第二麦克风采集的目标语音,
T
为时延差,用于表示
x1(t)
相对于
x2(t

t0)
的时间差

[0013]通过采用上述技术方案,通过公式
argmax[∫x1(t)x2(t

t0)dt],可以确定时延差
T
,它表示第一麦克风采集的目标语音相对于第二麦克风采集的目标语音的时间差

根据时延差的大小,可以确定目标语音的方向

通过计算交叉相关函数的最大值,上述技术方案可以确定目标语音的方向

[0014]可选地,将所述目标语音转换为控制指令,以便于通过所述控制指令控制所述终端设备运行,具体包括:将所述目标语音转换为文本;对所述文本进行关键词提取,得到目标关键词;将所述目标关键词与预设指令库进行匹配,得到所述目标关键词对应的控制指令;基于所述控制指令,控制所述终端设备执行所述控制指令

[0015]通过采用上述技术方案,将目标语音转换为文本,将语音中的内容转化为可处理的文本形式

通过语音识别技术,将语音信号转化为对应的文字

通过关键词提取,可以从文本中抽取出与目标操作相关的关键词

将提取出的目标关键词与预设的指令库进行匹配,找到与目标关键词相匹配的指令信息

指令库中存储了与不同关键词对应的操作指令,匹配过程能够确定目标关键词对应的指令信息

基于匹配到的指令信息,控制目标设备执行相应的指令

根据匹配到的指令信息,可以对目标设备进行相应的操作控制,实现设备的运行控制

通过将目标语音转换为文本,并匹配指令信息,上述技术方案可以实现通过语音控制目标设备的运行

[0016]可选地,预设指令库存储有指令信息与关键词之间的对应关系

[0017]通过采用上述技术方案,将提取出的目标关键词与预设的指令库进行匹配,找到与目标关键词相匹配的指令信息

预设指令库中存储了指令信息与关键词之间的对应关系,匹配过程能够确定目标关键词对应的指令信息

基于匹配到的指令信息,控制目标设备执行相应的指令

通过将目标语音转换为文本,并匹配预设指令库中的指令信息,可以实现通过语音控制目标设备的运行

[0018]可选地,基于目标语音的方向,对目标语音以外的干扰语音进行杂音降噪,得到降噪后的目标语音,具本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于语音降噪的声控方法,其特征在于,应用于终端设备,所述方法包括:获取麦克风阵列采集的语音,所述麦克风阵列包括多个麦克风;根据多个所述麦克风各自接收到所述语音的时间点,确定目标语音的方向;基于所述目标语音的方向,对目标语音以外的干扰语音进行杂音降噪,得到降噪后的目标语音;将所述降噪后的目标语音转换为控制指令,以便于通过所述控制指令控制所述终端设备运行
。2.
根据权利要求1所述的方法,其特征在于,所述基于所述目标语音的方向,对目标语音以外的干扰语音进行杂音降噪,得到降噪后的目标语音,具体包括:将所述语音与预先构建的噪音模型进行相似度计算,所述语音包括所述目标语音和所述干扰语音;所述噪音模型包括多种类型的噪音;从所述语音中去除所述干扰噪音,得到降噪后的所述目标噪音;其中,所述干扰噪音为所述语音中与所述噪音模型相似度大于相似度阈值的噪音
。3.
根据权利要求1所述的方法,其特征在于,所述根据多个所述麦克风各自接收到所述语音的时间点,确定目标语音的方向,具体包括:对多个所述麦克风采集到的所述目标语音进行滤波操作;选取多个所述麦克风中任意一个麦克风作为第一麦克风,选取多个所述麦克风中除所述第一麦克风以外的任意一个麦克风作为第二麦克风;将所述第二麦克风采集的所述目标语音与所述第一麦克风采集的所述目标语音进行交叉相关运算,得到时延差;根据所述时延差,确定所述目标语音的方向
。4.
根据权利要求3所述的方法,其特征在于,所述时延差的计算公式具体为:
T

argmax[∫x1(t)x2(t

t0)dt]
其中,
t
为时间,
x1(t)
为所述第一麦克风采集的目标语音,
x2(t

t0)
为第二麦克风采集的目标语音,
T
为时延差,用于表示
x1(t)
相对于
x2(t

t0)
的时间差
。5.
根据权利要求1所述的方法,其特征在于,将所述降噪后的目标语音转换为控制指令,以便于通过所述控制指令控制所述终端设备运行,具体包括:将所述目标语音转换为文本;对所述文本进行关键词提取,得到目标关键词;将所述目标关键词与预设指令库进...

【专利技术属性】
技术研发人员:张思芳史秋影魏智辉
申请(专利权)人:深圳北极鸥半导体有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1