语音增强方法、相关设备及可读存储介质技术

技术编号:23935854 阅读:25 留言:0更新日期:2020-04-25 03:07
本申请公开了一种语音增强方法、相关设备及可读存储介质,获取语音播放端所处环境的噪音空间分布特征;根据噪音空间分布特征确定语音播放端所处环境噪音最小的目标区域,获取待播放语音后,将待播放语音的声像调整到目标区域。由于人耳天然具有空间反掩蔽能力,也就是说,即使周围噪音很大,只要噪音声像与语音声像能区分开,人就能够分别接收不同声像的声音,因此,本申请中,目标区域噪音最小,将待播放语音的声像调整到目标区域,对语音的影响最小,因此可以使语音播放端播放的语音被接听者听清。

Speech enhancement methods, related devices and readable storage media

【技术实现步骤摘要】
语音增强方法、相关设备及可读存储介质
本申请涉及语音处理
,更具体的说,是涉及一种语音增强方法、相关设备及可读存储介质。
技术介绍
语音不仅是人与人之间进行信息交流最直接、最方便和最有效的工具,而且也是人与机器之间进行通信的重要工具。在不同场景中,语音总是会受到外界环境噪音的干扰,这些噪音包括从周围环境、传输媒介中引入的噪音、通信设备内部电噪音乃至其他说话人的声音等。这些噪音的干扰会使语音播放端的语音成为受噪音污染的语音,当噪音的干扰严重时,语音播放端的语音将完全淹没到噪音中,无法被语音接听者听清。以汽车场景为例,随着汽车行业的发展,汽车已经成为每个家庭必不可少的交通工具,伴随着消费升级、车联网的快速推进以及5G的普及,汽车也随之变得更加智能化和人性化,车载信息娱乐系统逐渐成为各种车型的基本配置。用户可以通过车载信息娱乐系统实现语音通话。然而,车内环境中存在的噪音(如,胎噪、引擎噪音、其他乘客的声音等),往往导致汽车端接收的语音无法被语音接听者听清。因此,如何使在语音播放端播放的语音被语音接听者听清,成为本领域技术人员亟待解决的技术问题。
技术实现思路
鉴于上述问题,本申请提供一种语音增强方法、相关设备及可读存储介质。具体方案如下:一种语音增强方法,包括:获取语音播放端所处环境的噪音空间分布特征;根据所述噪音空间分布特征确定目标区域,所述目标区域为所述语音播放端所处环境噪音最小的区域;获取待播放语音;将所述待播放语音的声像调整到所述目标区域。可选地,所述根据所述噪音空间分布特征确定目标区域,所述目标区域为所述语音播放端所处环境噪音最小的区域,包括:确定所述语音播放端所处环境的待播放语音区域,所述待播放语音区域包括多个子区域;根据所述噪音空间分布特征,确定每个所述子区域的噪音大小;确定噪音最小的子区域为所述目标区域。可选地,所述获取待播放语音,包括:获取所述语音播放端接收的由语音发送端传输的第一语音;确定所述第一语音为所述待播放语音。可选地,所述获取待播放语音,包括:获取所述语音播放端接收的由语音发送端传输的第一语音;获取所述目标区域的噪音频率谱;根据所述目标区域的噪音频率谱对所述第一语音进行补偿处理,得到第二语音;确定所述第二语音为所述待播放语音。可选地,所述根据所述目标区域的噪音频率谱对所述第一语音进行补偿处理,得到第二语音,包括:基于对所述第一语音进行补偿处理后的语音部分响度与所述第一语音的部分响度差异最小的准则,以及,对所述第一语音进行补偿处理后的语音可懂度高于所述第一语音的语音可懂度的准则,根据所述目标区域的噪音频率谱对所述第一语音进行补偿处理,得到第二语音。可选地,所述将待播放语音的声像调整到所述目标区域,包括:获取与所述目标区域对应的各个扬声器的预置参数;根据所述各个扬声器的预置参数对所述语音播放端所处环境内设置的各个扬声器进行参数配置,参数配置完成的扬声器输出的所述待播放语音的声像为所述目标区域。可选地,所述将待播放语音的声像调整到所述目标区域,包括:获取与所述目标区域对应的标定频响曲线;基于所述标定频响曲线,对所述语音播放端所处环境内设置的各个扬声器进行参数调整,使通过参数调整后的各个扬声器输出的所述待播放语音的声像为所述目标区域。可选地,所述将待播放语音的声像调整到所述目标区域,包括:对所述待播放语音的左右声道的时延以及幅度进行调整,使通过所述语音播放端所处环境内设置的各个扬声器输出的调整后的语音的声像为所述目标区域。可选地,在所述将待播放语音的声像调整到所述目标区域之后,所述方法还包括:获取所述语音播放端待传输至所述语音发送端的第三语音;获取所述第一语音中包含的噪音的特征;根据所述第一语音中包含的噪音的特征确定所述语音发送端对应的标定噪声频率谱;根据所述标定噪声频率谱对所述第三语音进行补偿处理,得到第四语音;将所述第四语音传输至所述语音发送端。可选地,所述根据所述标定噪声频率谱对所述第三语音进行补偿处理,得到第四语音,包括:基于对所述第三语音进行补偿处理后的语音部分响度与所述第三语音的部分响度差异最小的准则,以及,对所述第三语音进行补偿处理后的语音可懂度高于所述第三语音的语音可懂度的准则,根据所述标定噪声频率谱对所述第三语音进行补偿处理,得到第四语音。一种语音增强装置,包括:噪音空间分布特征获取单元,用于获取语音播放端所处环境的噪音空间分布特征;目标区域确定单元,用于根据所述噪音空间分布特征确定目标区域,所述目标区域为所述语音播放端所处环境噪音最小的区域;待播放语音获取单元,用于获取待播放语音;调整单元,用于将所述待播放语音的声像调整到所述目标区域。可选地,所述目标区域确定单元,包括:待播放语音区域确定单元,用于确定所述语音播放端所处环境的待播放语音区域,所述待播放语音区域包括多个子区域;噪音大小确定单元,用于根据所述噪音空间分布特征,确定每个所述子区域的噪音大小;目标区域确定子单元,用于确定噪音最小的子区域为所述目标区域。可选地,所述待播放语音获取单元,包括:第一语音获取单元,用于获取所述语音播放端接收的由语音发送端传输的第一语音;第一待播放语音确定单元,用于确定所述第一语音为所述待播放语音。可选地,所述待播放语音获取单元,包括:第一语音获取单元,用于获取所述语音播放端接收的由语音发送端传输的第一语音;噪音频率谱获取单元,用于获取所述目标区域的噪音频率谱;第二语音生成单元,用于根据所述目标区域的噪音频率谱对所述第一语音进行补偿处理,得到第二语音;第二待播放语音确定单元,用于确定所述第二语音为所述待播放语音。可选地,所述第二语音生成单元,具体用于:基于对所述第一语音进行补偿处理后的语音部分响度与所述第一语音的部分响度差异最小的准则,以及,对所述第一语音进行补偿处理后的语音可懂度高于所述第一语音的语音可懂度的准则,根据所述目标区域的噪音频率谱对所述第一语音进行补偿处理,得到第二语音。可选地,所述调整单元,包括:预置参数获取单元,用于获取与所述目标区域对应的各个扬声器的预置参数;参数配置单元,用于根据所述各个扬声器的预置参数对所述语音播放端所处环境内设置的各个扬声器进行参数配置,参数配置完成的扬声器输出的所述待播放语音的声像为所述目标区域。可选地,所述调整单元,包括:标定频响曲线获取单元,用于获取与所述目标区域对应的标定频响曲线;参数调整单元,用于基于所述标定频响曲线,对所述语音播放端所处环境内设置的各个扬声器进行参数调整,使通过参数调整后的各个扬声器输出的所述待播放语音的声像为所述目标区域。可选地,所述调整单元本文档来自技高网...

【技术保护点】
1.一种语音增强方法,其特征在于,包括:/n获取语音播放端所处环境的噪音空间分布特征;/n根据所述噪音空间分布特征确定目标区域,所述目标区域为所述语音播放端所处环境噪音最小的区域;/n获取待播放语音;/n将所述待播放语音的声像调整到所述目标区域。/n

【技术特征摘要】
1.一种语音增强方法,其特征在于,包括:
获取语音播放端所处环境的噪音空间分布特征;
根据所述噪音空间分布特征确定目标区域,所述目标区域为所述语音播放端所处环境噪音最小的区域;
获取待播放语音;
将所述待播放语音的声像调整到所述目标区域。


2.根据权利要求1所述的方法,其特征在于,所述根据所述噪音空间分布特征确定目标区域,所述目标区域为所述语音播放端所处环境噪音最小的区域,包括:
确定所述语音播放端所处环境的待播放语音区域,所述待播放语音区域包括多个子区域;
根据所述噪音空间分布特征,确定每个所述子区域的噪音大小;
确定噪音最小的子区域为所述目标区域。


3.根据权利要求1所述的方法,其特征在于,所述获取待播放语音,包括:
获取所述语音播放端接收的由语音发送端传输的第一语音;
确定所述第一语音为所述待播放语音。


4.根据权利要求1所述的方法,其特征在于,所述获取待播放语音,包括:
获取所述语音播放端接收的由语音发送端传输的第一语音;
获取所述目标区域的噪音频率谱;
根据所述目标区域的噪音频率谱对所述第一语音进行补偿处理,得到第二语音;
确定所述第二语音为所述待播放语音。


5.根据权利要求4所述的方法,其特征在于,所述根据所述目标区域的噪音频率谱对所述第一语音进行补偿处理,得到第二语音,包括:
基于对所述第一语音进行补偿处理后的语音部分响度与所述第一语音的部分响度差异最小的准则,以及,对所述第一语音进行补偿处理后的语音可懂度高于所述第一语音的语音可懂度的准则,根据所述目标区域的噪音频率谱对所述第一语音进行补偿处理,得到第二语音。


6.根据权利要求1所述的方法,其特征在于,所述将待播放语音的声像调整到所述目标区域,包括:
获取与所述目标区域对应的各个扬声器的预置参数;
根据所述各个扬声器的预置参数对所述语音播放端所处环境内设置的各个扬声器进行参数配置,参数配置完成的扬声器输出的所述待播放语音的声像为所述目标区域。


7.根据权利要求1所述的方法,其特征在于,所述将待播放语音的声像调整到所述目标区域,包括:
获取与所述目标区域对应的标定频响曲...

【专利技术属性】
技术研发人员:马桂林许震洪陶然
申请(专利权)人:科大讯飞苏州科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1