语音处理方法、装置及终端设备制造方法及图纸

技术编号:17472966 阅读:26 留言:0更新日期:2018-03-15 09:04
本发明专利技术提供了一种语音处理方法、装置及终端设备,其中,该方法包括:获取进行语音通话的语音通话信息;获取与所述语音通话信息对应的用户面部特征信息;在所述语音通话信息无法识别的情况下,根据获取的所述用户面部特征信息模拟出所述语音通话信息的备用语音通话信息。通过本发明专利技术,解决了相关技术中语音通话的改善方案,存在背景噪音严重时语音的识别度差的问题,达到了提高语音通话质量的效果。

Speech processing methods, devices and terminal equipment

The invention provides a voice processing method, device and terminal equipment, wherein, the method comprises the following steps: acquiring voice voice call information; user facial feature information acquisition and the corresponding voice information; in the voice information is not recognized by the user according to the facial features of information acquisition to simulate the standby voice call information call information. Through the invention, the improvement scheme of voice calls in related technologies is solved, and the problem of poor speech recognition is achieved when the background noise is serious, so as to achieve the effect of improving the quality of voice calls.

【技术实现步骤摘要】
语音处理方法、装置及终端设备
本专利技术涉及通信领域,具体而言,涉及一种语音处理方法、装置及终端设备。
技术介绍
在移动终端设备上进行音频或者视频通话的时候,在通讯背景噪音严重的情况下,语音的识别度就很差,严重影响语音通信的进行。目前,在移动终端设备上已有的语音通话改善技术,主要是通过双麦克降低背景噪声的方案等。对于上述通过双麦克方式降低背景噪声的方案,当环境噪声比较大或噪声环境复杂时,降噪效果不好,也会引起接收方语音响度明显降低,甚至难以分辨。此外,该方案对器件一致性要求高,对结构布局、密封要求高,还会引起产品成本上升等问题。因此,相关技术中语音通话的改善方案,存在背景噪音严重时语音的识别度差的问题。
技术实现思路
本专利技术实施例提供了语音处理方法、装置及终端设备,以至少解决相关技术中语音通话的改善方案,存在背景噪音严重时语音的识别度差的问题。根据本专利技术的一个实施例,提供了一种语音处理方法,包括:获取进行语音通话的语音通话信息;获取与所述语音通话信息对应的用户面部特征信息;在所述语音通话信息无法识别的情况下,根据获取的所述用户面部特征信息模拟出所述语音通话信息的备用语音通话信息。可选地,在所述面部特征信息包括腮部震动信息的情况下,获取与所述语音通话信息对应的所述用户面部特征信息包括:获取进行所述语音通话的终端设备的前壳的运动信息;根据获取的所述终端设备的所述前壳的所述运动信息,确定在进行所述语音通话时用户腮部震动的腮部震动信息。可选地,在根据获取的所述终端设备的所述前壳的所述运动信息,确定在进行所述语音通话时用户腮部震动的所述腮部震动信息之后,还包括:将获取的所述腮部震动信息,转换为与所述腮部震动信息对应的电压信息;将转换后的所述电压信息,经过模拟/数字A/D转换后,生成与所述腮部震动信息对应的信息代码。可选地,根据获取的所述用户面部特征信息模拟出所述语音通话信息的所述备用语音通话信息包括:根据获取的所述腮部震动信息,确定用于表征通话内容的表意信息和用于表征腮部震动强弱的震动强度信息;根据确定的所述表意信息,以及所述震动强度信息,模拟所述语音通话信息的所述备用语音通话信息。可选地,在所述面部特征信息包括通话口型信息的情况下,获取与所述语音通话信息对应的用户面部特征信息包括:通过进行所述语音通话时使用的终端设备的图像获取装置,获取在进行所述语音通话时用户通话口型的通话口型信息。可选地,根据获取的所述用户面部特征信息模拟出所述语音通话信息的所述备用语音通话信息包括:将获取的所述通话口型信息,转化为与所述通话口型信息对应的第一语音信息;根据所述第一语音信息,确定所述语音通话信息的所述备用语音通话信息。可选地,在根据获取的所述用户面部特征信息模拟出所述语音通话信息的所述备用语音通话信息之后,还包括以下至少之一:根据语音声纹特征库中与所述语音通话对应的用户声纹特征信息,对所述备用语音通话信息的频率和/或音色进行调制,获取与所述备用语音通话信息对应的语音调制信息;将预设的背景音效与所述备用语音通话信息进行混音,生成混音信息;将输入的文字信息转换后获得的第二语音信息插入到所述备用语音通话信息的预设位置,生成第三语音信息。可选地,在根据获取的所述用户面部特征信息模拟出所述语音通话信息的所述备用语音通话信息之后,还包括:将所述备用语音通话信息发送给接收所述语音通话的终端设备。可选地,在根据获取的所述用户面部特征信息模拟出所述语音通话信息的所述备用语音通话信息之后,还包括:播放所述备用语音通话信息。可选地,播放所述备用语音通话信息包括:根据所述备用语音通话信息,确定用于控制终端设备的前壳震动的控制信息;根据确定的所述控制信息,控制所述终端设备的所述前壳进行震动。根据本专利技术的另一个实施例,提供了一种语音处理装置,包括:第一获取模块,用于获取进行语音通话的语音通话信息;第二获取模块,用于获取与所述语音通话信息对应的用户面部特征信息;模拟模块,用于在所述语音通话信息无法识别的情况下,根据获取的所述用户面部特征信息模拟出所述语音通话信息的备用语音通话信息。可选地,所述第二获取模块包括:第一获取单元,用于在所述面部特征信息包括腮部震动信息的情况下,获取进行所述语音通话的移动终端的前壳的运动信息;第一确定单元,用于根据获取的所述移动终端的所述前壳的所述运动信息,确定在进行所述语音通话时用户腮部震动的腮部震动信息。可选地,所述第二获取模块还包括:转换单元,用于将获取的所述腮部震动信息,转换为与所述腮部震动信息对应的电压信息;生成单元,用于将转换后的所述电压信息,经过模拟/数字A/D转换后,生成与所述腮部震动信息对应的信息代码。可选地,所述模拟模块包括:第二确定单元,用于根据获取的所述腮部震动信息,确定用于表征通话内容的表意信息和用于表征腮部震动强弱的震动强度信息;模拟单元,用于根据确定的所述表意信息,以及所述震动强度信息,模拟所述语音通话信息的所述备用语音通话信息。可选地,所述获取模块包括:第二获取单元,用于在所述面部特征信息包括通话口型信息的情况下,通过进行所述语音通话时使用的移动终端的图像获取装置,获取在进行所述语音通话时用户通话口型的通话口型信息。可选地,所述模拟模块包括:转化模块,用于将获取的所述通话口型信息,转化为与所述通话口型信息对应的第一语音信息;第三确定模块,用于根据所述第一语音信息,确定所述语音通话信息的所述备用语音通话信息。可选地,所述装置还包括以下至少之一:调制模块,用于根据语音声纹特征库中与所述语音通话对应的用户声纹特征信息,对所述备用语音通话信息的频率和/或音色进行调制,获取与所述备用语音通话信息对应的语音调制信息;混音模块,用于将预设的背景音效与所述备用语音通话信息进行混音,生成混音信息;生成模块,用于将输入的文字信息转换后获得的第二语音信息插入到所述备用语音通话信息的预设位置,生成第三语音信息。可选地,所述装置还包括:发送模块,用于将所述备用语音通话信息发送给所述语音通话的对端设备。可选地,所述装置还包括:播放模块,播放所述备用语音通话信息。可选地,所述播放模块包括:第四确定单元,用于根据所述备用语音通话信息,确定用于控制移动终端的前壳震动的控制信息;控制单元,用于根据确定的所述控制信息,控制所述移动终端的所述前壳进行震动。根据本专利技术的又一个实施例,还提供了一种终端设备,所述终端设备包括前述任一项所述的装置。根据本专利技术的又一个实施例,还提供了一种存储介质。该存储介质设置为存储用于执行以下步骤的程序代码:获取进行语音通话的语音通话信息;获取与所述语音通话信息对应的用户面部特征信息;在所述语音通话信息无法识别的情况下,根据获取的所述用户面部特征信息模拟出所述语音通话信息的备用语音通话信息。可选地,存储介质还设置为存储用于执行以下步骤的程序代码:在所述面部特征信息包括腮部震动信息的情况下,获取与所述语音通话信息对应的所述用户面部特征信息包括:获取进行所述语音通话的终端设备的前壳的运动信息;根据获取的所述终端设备的所述前壳的所述运动信息,确定在进行所述语音通话时用户腮部震动的腮部震动信息。可选地,存储介质还设置为存储用于执行以下步骤的程序代码:在根据获取的所述终端设备的所述前壳的所述运动信息,确定在进行所述本文档来自技高网...
语音处理方法、装置及终端设备

【技术保护点】
一种语音处理方法,其特征在于,包括:获取进行语音通话的语音通话信息;获取与所述语音通话信息对应的用户面部特征信息;在所述语音通话信息无法识别的情况下,根据获取的所述用户面部特征信息模拟出所述语音通话信息的备用语音通话信息。

【技术特征摘要】
1.一种语音处理方法,其特征在于,包括:获取进行语音通话的语音通话信息;获取与所述语音通话信息对应的用户面部特征信息;在所述语音通话信息无法识别的情况下,根据获取的所述用户面部特征信息模拟出所述语音通话信息的备用语音通话信息。2.根据权利要求1所述的方法,其特征在于,在所述面部特征信息包括腮部震动信息的情况下,获取与所述语音通话信息对应的所述用户面部特征信息包括:获取进行所述语音通话的终端设备的前壳的运动信息;根据获取的所述终端设备的所述前壳的所述运动信息,确定在进行所述语音通话时用户腮部震动的腮部震动信息。3.根据权利要求2所述的方法,其特征在于,在根据获取的所述终端设备的所述前壳的所述运动信息,确定在进行所述语音通话时用户腮部震动的所述腮部震动信息之后,还包括:将获取的所述腮部震动信息,转换为与所述腮部震动信息对应的电压信息;将转换后的所述电压信息,经过模拟/数字A/D转换后,生成与所述腮部震动信息对应的信息代码。4.根据权利要求2所述的方法,其特征在于,根据获取的所述用户面部特征信息模拟出所述语音通话信息的所述备用语音通话信息包括:根据获取的所述腮部震动信息,确定用于表征通话内容的表意信息和用于表征腮部震动强弱的震动强度信息;根据确定的所述表意信息,以及所述震动强度信息,模拟所述语音通话信息的所述备用语音通话信息。5.根据权利要求1所述的方法,其特征在于,在所述面部特征信息包括通话口型信息的情况下,获取与所述语音通话信息对应的用户面部特征信息包括:通过进行所述语音通话时使用的终端设备的图像获取装置,获取在进行所述语音通话时用户通话口型的通话口型信息。6.根据权利要求5所述的方法,其特征在于,根据获取的所述用户面部特征信息模拟出所述语音通话信息的所述备用语音通话信息包括:将获取的所述通话口型信息,转化为与所述通话口型信息对应的第一语音信息;根据所述第一语音信息,确定所述语音通话信息的所述备用语音通话信息。7.根据权利要求1所述的方法,其特征在于,在根据获取的所述用户面部特征信息模拟出所述语音通话信息的所述备用语音通话信息之后,还包括以下至少之一:根据语音声纹特征库中与所述语音通话对应的用户声纹特征信息,对所述备用语音通话信息的频率和/或音色进行调制,获取与所述备用语音通话信息对应的语音调制信息;将预设的背景音效与所述备用语音通话信息进行混音,生成混音信息;将输入的文字信息转换后获得的第二语音信息插入到所述备用语音通话信息的预设位置,生成第三语音信息。8.根据权利要求1至7中任一项所述的方法,其特征在于,在根据获取的所述用户面部特征信息模拟出所述语音通话信息的所述备用语音通话信息之后,还包括:将所述备用语音通话信息发送给接收所述语音通话的终端设备。9.根据权利要求1所述的方法,其特征在于,在根据获取的所述用户面部特征信息模拟出所述语音通话信息的所述备用语音通话信息之后,还包括:播放所述备用语音通话信息。10.根据权利要求9所述的方法,其特征在于,播放所述备用语音通话信息包括:根据所述备用语音通话信息,确定用于控制终端设备的前壳震动的控制信...

【专利技术属性】
技术研发人员:罗雨来
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1