【技术实现步骤摘要】
用于机器人的语音增强方法、装置及机器人
[0001]本申请涉及语音处理
,尤其涉及一种用于机器人的语音增强方法、装置和机器人。
技术介绍
[0002]随着机器人的不断发展,机器人宠物越来越普及。然而,机器人宠物,例如足式机器人,在与人语音交互过程中,其是不断运动的。与传统固定的智能设备(如智能音箱)不同,由于机器宠物的不断运动,其自身会产生很多噪声,例如驱动电机的噪声,运动过程中关节部分机械传动噪声等等,这些噪声会对语音的识别产生很大的干扰。
[0003]此外,由于机器人时刻处于运动状态,因此其可能会距离用户非常远,此时由于自身噪声以及环境噪声的影响,就会导致用户的语音质量较差,从而导致机器人无法准确响应用户的指令。
技术实现思路
[0004]本申请提供一种用于机器人的语音增强方法、装置和机器人,以至少解决相关技术中语音信息质量较差的问题。本申请的技术方案如下:
[0005]根据本申请实施例的第一方面,提供一种用于机器人的语音增强方法,包括:
[0006]获取机器人采集的语音信息;
[0007]对所述语音信息进行第一增强以生成初始增强语音信息,并根据所述语音信息生成所述语音信息的声道参数;以及
[0008]根据所述声道参数和所述初始增强语音信息进行第二增强生成增强语音信息。
[0009]可选地,所述对所述语音信息进行第一增强以生成初始增强语音信息,包括:
[0010]对所述语音信息进行降采样,以生成第一语音信息;
[0011]根据所 ...
【技术保护点】
【技术特征摘要】
1.一种用于机器人的语音增强方法,其特征在于,包括:获取机器人采集的语音信息,并根据所述语音信息生成所述语音信息的声道参数;对所述语音信息进行第一增强以生成初始增强语音信息;根据所述声道参数和所述初始增强语音信息进行第二增强以生成增强语音信息。2.如权利要求1所述的方法,其特征在于,所述对所述语音信息进行第一增强以生成初始增强语音信息,包括:对所述语音信息进行降采样,以生成第一语音信息;根据所述第一语音信息生成所述第一语音信息对应的激励谱;对所述第一语音信息进行降噪以生成降噪之后的第一语音信息;根据所述激励谱和所述降噪之后的第一语音信息生成所述初始增强语音信息。3.如权利要求2所述的方法,其特征在于,所述根据所述第一语音信息生成所述第一语音信息对应的激励谱,包括:对所述第一语音信息进行非负矩阵分解NMF以生成所述第一语音信息的语音帧概率;对所述第一语音信息进行第一基音估计以生成所述第一语音信息的初始基音估计值;根据所述语音帧概率,对所述初始基音估计值进行第二基音估计,以生成目标基音估计值;根据所述目标基音估计值生成所述激励谱。4.如权利要求3所述的方法,其特征在于,所述对所述第一语音信息进行非负矩阵分解NMF以生成所述第一语音信息的语音帧概率,包括:对所述第一语音信息中的每一帧语音信号进行傅里叶变换,以生成所述每一帧语音信号的谱矩阵;基于预获取的语音基矩阵,对所述每一帧语音信号的谱矩阵进行分解运算,以获取所述每一帧语音信号的谱矩阵对应的语音激活矩阵和更新后的语音基矩阵;基于预获取的干扰基矩阵,对所述每一帧语音信号的谱矩阵进行分解运算,以获取所述每一帧语音信号的谱矩阵对应的干扰激活矩阵和更新后的干扰基矩阵;基于所述更新后的语音基矩阵及所述更新后的干扰基矩阵,对所述每一帧语音信号的谱矩阵进行重复分解运算,以获取所述每一帧语音信号的谱矩阵对应的目标干扰激活矩阵及目标语音激活矩阵;根据所述目标干扰激活矩阵及所述目标语音激活矩阵,确定所述第一语音信息中每一帧语音信号的语音帧概率。5.如权利要求4所述的方法,其特征在于,所述预获取的语音基矩阵,包括以下步骤:获取样本语音信号;对所述样本语音信号进行分帧,得到N帧子信号,其中,N为正整数;对所述N帧子信号中的每一帧子信号进行傅里叶变换,以确定每一帧信号中包含的F个频点的谱值,其中,F为正整数;根据每一帧子信号中包含的F个频点的谱值,生成所述样本语音信号对应的包括F行和N列的第一样本谱矩阵;对所述第一样本谱矩阵进行聚类,以生成包括K列向量的所述预获取的语音基矩阵,其中,K是小于等于N的正整数。
6.如权利要求4所述的方法,其特征在于,所述预获取的干扰基矩阵,包括以下步骤:获取样本干扰信号,所述样本干扰信号是所述机...
【专利技术属性】
技术研发人员:李炯亮,
申请(专利权)人:北京小米移动软件有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。