一种去除机械噪声的方法、装置及机器人制造方法及图纸

技术编号:32549624 阅读:14 留言:0更新日期:2022-03-05 11:49
本公开涉及一种去除机械噪声的方法、装置及机器人,尤其涉及音频处理技术领域。包括:获取用户音频信号;将用户音频信号输入目标延时滤波器,以去除用户音频信号中机器人的机械噪声,得到用户语音信号。其中,目标延时滤波器为根据预先录制的机器人的机械噪声进行训练后得到的延时滤波器。本公开实施例用于解决机械噪声会对机器人识别用户语音造成影响,导致识别不准确的问题。别不准确的问题。别不准确的问题。

【技术实现步骤摘要】
一种去除机械噪声的方法、装置及机器人


[0001]本公开涉及音频处理
,尤其涉及一种去除机械噪声的方法、装置及机器人。

技术介绍

[0002]目前一些具有语音交互功能的机器人,在和用户进行语音交互时,会采集用户语音,并识别用户语音对应的指令内容,并针对这些指令内容进行响应。但是在一些场景下,在机器人与用户进行语音交互时,可能机器人正在移动中或者正在执行某一动作,由于机器人通常是由机械部件组成,在机器人移动中,或者执行某一动作的过程中,可能会产生机械噪声,这样的场景下机器人采集用户语音时,也会采集到机器人自身产生的机械噪声,这些机械噪声会对机器人识别用户语音造成影响,导致识别不准确的问题。

技术实现思路

[0003]为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种去除机械噪声的方法、装置及机器人,可以去除用户音频信号中的机械噪声,提高识别准确度。
[0004]为了实现上述目的,本公开实施例提供的技术方案如下:
[0005]第一方面,提供一种去除机械噪声的方法,应用于机器人,包括:
[0006]获取用户音频信号;
[0007]将所述用户音频信号输入目标延时滤波器,以去除所述用户音频信号中机器人的机械噪声,得到用户语音信号;
[0008]其中,所述目标延时滤波器为根据预先录制的所述机器人的机械噪声进行滤波参数更新后得到的延时滤波器。
[0009]作为本公开实施例一种可选的实施方式,所述获取用户音频信号之前,所述方法包括:
[0010]录制所述机器人的机械噪声;
[0011]从所述机械噪声中提取噪声特征信息,所述噪声特征信息包括:MFCC特征信息,和/或,PLP特征信息;
[0012]根据所述噪声特征信息更新初始延时滤波器的滤波参数,以得到所述目标延时滤波器。
[0013]作为本公开实施例一种可选的实施方式,所述获取用户音频信号,包括:
[0014]采集原始音频;
[0015]对所述原始音频进行人声检测,从所述原始音频中获取人声音频片段;
[0016]从所述人声音频片段中提取目标声纹信息;
[0017]在所述目标声纹信息与预先存储的声纹信息匹配时,从所述人声音频片段中确定所述用户音频信号。
[0018]作为本公开实施例一种可选的实施方式,所述从所述人声音频片段中提取目标声纹信息,包括:
[0019]将所述人声音频片段分割为若干音频子片段;
[0020]提取所述若干音频子片段中每个音频子片段的特征信息,根据所述每个音频子片段的特征信息进行音频聚类,得到多个聚类人声片段,其中,每个聚类人声片段为由多个音频子片段聚类得到的;
[0021]获取目标聚类人声片段的所述目标声纹信息,所述目标聚类人声片段为时长最长的聚类人声片段;
[0022]所述在所述目标声纹信息与预先存储的声纹信息匹配时,从所述人声音频片段中确定所述用户音频信号,包括:
[0023]在所述目标声纹信息与预先存储的声纹信息匹配时,确定所述目标聚类人声片段作为所述用户音频信号。
[0024]作为本公开实施例一种可选的实施方式,所述将所述用户音频信号输入目标延时滤波器,以去除所述用户音频信号中的机械噪声,得到用户语音信号之后,所述方法还包括:
[0025]识别所述用户语音信号对应的指令内容,响应所述指令内容。
[0026]作为本公开实施例一种可选的实施方式,所述识别所述用户语音信号对应的指令内容,响应所述指令内容,包括:
[0027]识别所述用户语音信号对应的所述指令内容;
[0028]若所述指令内容与预设指令的相似度大于或等于第一预设参数,则执行所述预设指令对应的操作,以响应所述指令内容。
[0029]作为本公开实施例一种可选的实施方式,所述若所述指令内容与预设指令的相似度大于或等于第一预设参数,则执行所述预设指令对应的操作,以响应所述指令内容,包括:
[0030]若所述指令内容与预设指令的相似度大于或等于第一预设参数,且所述指令内容与预设合成音频内容的相似度小于或等于第二预设参数,则执行所述预设指令对应的操作,以响应所述指令内容;
[0031]其中,所述预设合成音频内容为预先存储的用于回复用户语音的音频内容。
[0032]第二方面,提供一种去除机械噪声的装置,包括:
[0033]获取模块,用于获取用户音频信号;
[0034]噪声去除模块,用于将所述用户音频信号输入目标延时滤波器,以去除所述用户音频信号中机器人的机械噪声,得到用户语音信号;
[0035]其中,所述目标延时滤波器为根据预先录制的所述机器人的机械噪声进行滤波参数更新后得到的延时滤波器。
[0036]作为本公开实施例一种可选的实施方式,所述获取模块,还用于:
[0037]录制所述机器人的机械噪声;
[0038]从所述机械噪声中提取噪声特征信息,所述噪声特征信息包括:MFCC特征信息,和/或,PLP特征信息;
[0039]根据所述噪声特征信息更新初始延时滤波器的滤波参数,以得到所述目标延时滤
波器。
[0040]作为本公开实施例一种可选的实施方式,所述获取模块,具体用于:
[0041]采集原始音频;
[0042]对所述原始音频进行人声检测,从所述原始音频中获取人声音频片段;
[0043]从所述人声音频片段中提取目标声纹信息;
[0044]在所述目标声纹信息与预先存储的声纹信息匹配时,从所述人声音频片段中确定所述用户音频信号。
[0045]作为本公开实施例一种可选的实施方式,所述获取模块,具体用于:
[0046]将所述人声音频片段分割为若干音频子片段;
[0047]提取所述若干音频子片段中每个音频子片段的特征信息,根据所述每个音频子片段的特征信息进行音频聚类,得到多个聚类人声片段,其中,每个聚类人声片段为由多个音频子片段聚类得到的;
[0048]获取所述目标聚类人声片段的所述目标声纹信息,所述目标聚类人声片段为时长最长的聚类人声片段;
[0049]在所述目标声纹信息与预先存储的声纹信息匹配时,确定所述目标聚类人声片段作为所述用户音频信号。
[0050]作为本公开实施例一种可选的实施方式,所述装置还包括:
[0051]响应模块,用于识别所述用户语音信号对应的指令内容,响应所述指令内容。
[0052]作为本公开实施例一种可选的实施方式,所述响应模块,具体用于:
[0053]识别所述用户语音信号对应的所述指令内容;
[0054]若所述指令内容与预设指令的相似度大于或等于第一预设参数,则执行所述预设指令对应的操作,以响应所述指令内容。
[0055]作为本公开实施例一种可选的实施方式,所述响应模块,还用于:若所述指令内容与预设指令的相似度大于或等于第一预设参数,且所述指令内容与预设合成音频内容的相似本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种去除机械噪声的方法,其特征在于,应用于机器人,包括:获取用户音频信号;将所述用户音频信号输入目标延时滤波器,以去除所述用户音频信号中的机械噪声,得到用户语音信号;其中,所述目标延时滤波器为根据预先录制的所述机器人的机械噪声进行滤波参数更新后得到的延时滤波器。2.根据权利要求1所述的方法,其特征在于,所述获取用户音频信号之前,所述方法包括:录制所述机器人的机械噪声;从所述机械噪声中提取噪声特征信息,所述噪声特征信息包括:MFCC特征信息,和/或,PLP特征信息;根据所述噪声特征信息更新初始延时滤波器的滤波参数,以得到所述目标延时滤波器。3.根据权利要求1所述的方法,其特征在于,所述获取用户音频信号,包括:采集原始音频;对所述原始音频进行人声检测,从所述原始音频中获取人声音频片段;从所述人声音频片段中提取目标声纹信息;在所述目标声纹信息与预先存储的声纹信息匹配时,从所述人声音频片段中确定所述用户音频信号。4.根据权利要求3所述的方法,其特征在于,所述从所述人声音频片段中提取目标声纹信息,包括:将所述人声音频片段分割为若干音频子片段;分别提取所述若干音频子片段中每个音频子片段的特征信息,根据所述每个音频子片段的特征信息进行音频聚类,得到多个聚类人声片段,其中,每个聚类人声片段由多个音频子片段聚类得到的;获取所述目标聚类人声片段的所述目标声纹信息,所述目标聚类人声片段为时长最长的聚类人声片段;所述在所述目标声纹信息与预先存储的声纹信息匹配时,从所述人声音频片段中确定所述用户音频信号,包括:在所述目标声纹信息与预先存储的声纹信息匹配时,确定所述目标聚类人声片段作为所述用户音频信号。5.根据权利要求1所述的方法,其特征在于,所述将所述用户音频信号输...

【专利技术属性】
技术研发人员:李良斌陈孝良
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1