语音处理方法、系统、设备及存储介质技术方案

技术编号:34096483 阅读:12 留言:0更新日期:2022-07-11 22:25
本发明专利技术提出一种语音处理方法、系统、设备及存储介质,该方法包括:对初始用户录制语音进行压限处理,获取压限后的用户录制语音;对压限后的用户录制语音进行不完全降噪处理,获取降噪后的用户录制语音;对降噪后的用户录制语音进行消歧,获取消歧后的用户录制语音;根据初始用户录制语音的平均音素数量,调整消歧后的用户录制语音中预先分帧的每一帧语音中因素的个数,获取调整后的每一帧语音;根据初始用户录制语音的平均音量大小,对调整后的每一帧语音的音量进行平衡处理,获取平衡化后的每一帧语音,并输出平均化后的每一帧语音。本发明专利技术使得用户录制语音更加顺畅,提升了听话人的听觉感受。的听觉感受。的听觉感受。

【技术实现步骤摘要】
语音处理方法、系统、设备及存储介质


[0001]本专利技术涉及语音处理
,尤其涉及一种语音处理方法、系统、设备及存储介质。

技术介绍

[0002]用户通过移动设备进行语音录制、语音通话时,由于收音环境存在噪声、发音不清晰、说话断续等情况,收录的声音可能出现人声不突出、难以分辨、停顿频繁,令听话人的听觉感受不佳。目前业界对语音的处理专注于降噪、回声消除等语音增强方案,目的在于减少环境音对人声的影响,并已经有了十足的发展,然而,这种处理主要专注于还原一个干净的录音环境,缺少对说话人声音的优化,忽视了听话人的听觉感受。人的发音有各自的发音特点,如语速快慢、停顿习惯、音量变化等,目前业内正缺少此类针对听话人的听感进行优化的方案。

技术实现思路

[0003]本专利技术提供一种语音处理方法、系统、设备及存储介质,其主要目的在于对用户录制语音进行优化,有效提高听话人的听觉感受。
[0004]第一方面,本专利技术实施例提供一种语音处理方法,包括:
[0005]对初始用户录制语音进行压限处理,获取压限后的用户录制语音;
[0006]对压限后的用户录制语音进行不完全降噪处理,获取降噪后的用户录制语音;
[0007]对降噪后的用户录制语音进行消歧,获取消歧后的用户录制语音;
[0008]根据所述初始用户录制语音的平均音素数量,调整消歧后的用户录制语音中预先分帧的每一帧语音中的因素个数,获取调整后的每一帧语音;
[0009]根据所述初始用户录制语音的平均音量大小,对调整后的每一帧语音的音量进行平衡处理,获取平衡化后的每一帧语音,并输出平衡化后的每一帧语音。
[0010]优选地,所述对压限后的用户录制语音进行不完全降噪处理,获取降噪后的用户录制语音,包括:
[0011]对压限后的用户录制语音进行降噪,使得降噪后的用户录制语音中噪声能量在压限后的用户录制语音中的噪声能量的预设比例范围之内。
[0012]优选地,所述对初始用户录制语音进行压限处理,获取压限后的用户录制语音,之前包括:
[0013]对原始用户录制语音进行静音检测,移除所述原始用户录制语音中的空白语音,获取静音检测后的用户录制语音,并将静音检测后的用户录制语音重新作为所述初始用户录制语音。
[0014]优选地,所述平均音素数量通过如下方式获得:
[0015]获取所述初始用户录制语音中的所有音素数量;
[0016]根据所述初始用户录制语音的时长和所有音素数量,获取所述平均音素数量。
[0017]优选地,所述根据所述初始用户录制语音的平均音素数量,调整消歧后的用户录制语音中预先分帧的每一帧语音中的因素个数,获取调整后的每一帧语音,具体包括:
[0018]根据所述平均因素数量,对消歧后的用户录制语音中预先分帧的每一帧语音中因素个数进行调整,使得调整后的每一帧语音的音素数量均在预设音素范围之内,获取调整后的每一帧语音。
[0019]优选地,所述根据所述初始用户录制语音的平均音量大小,对调整后的每一帧语音的音量进行平衡处理,获取平衡化后的每一帧语音,包括:
[0020]根据所述初始用户录制语音的平均音量,获取最大音量和最小音量;
[0021]压缩调整后的每一帧语音中大于所述最大音量的音量,放大每一帧语音中小于所述最小音量的音量;
[0022]获取平衡化后的每一帧语音。
[0023]优选地,所述对降噪后的用户录制语音进行消歧,获取消歧后的用户录制语音,包括:
[0024]将降噪后的用户录制语音输入到消歧神经网络中,获取消歧后的用户录制语音。
[0025]第二方面,本专利技术实施例提供一种语音处理系统,包括:
[0026]压限模块,用于对初始用户录制语音进行压限处理,获取压限后的用户录制语音;
[0027]降噪模块,用于对压限后的用户录制语音进行不完全降噪处理,获取降噪后的用户录制语音;
[0028]消歧模块,用于对降噪后的用户录制语音进行消歧,获取消歧后的用户录制语音;
[0029]分帧模块,用于根据所述初始用户录制语音的平均音素数量,调整消歧后的用户录制语音中预先分帧的每一帧语音中的因素个数,获取调整后的每一帧语音;
[0030]平衡模块,用于根据所述初始用户录制语音的平均音量大小,对调整后的每一帧语音的音量进行平衡处理,获取平衡化后的每一帧语音,并输出平衡化后的每一帧语音。
[0031]第三方面,本专利技术实施例提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述语音处理方法的步骤。
[0032]第四方面,本专利技术实施例提供一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述语音处理方法的步骤。
[0033]本专利技术提出的一种语音处理方法、系统、设备及存储介质,通过压限处理,将用户录制语音中的音量控制在一定范围之内,不会出现爆音或者音量消失的情况;然后对用户录制语音进行消歧,消除用户录制语音中的停顿词,使得用户录制语音听起来更加平滑;并且根据平均音素数量、平均音量大小对用户录制语音进行分帧和平衡处理,使得用户录制语音更加顺畅,提升了听话人的听觉感受,且平均因素数量和平均音量大小的计算可以与压限、消歧和平衡并行处理,从而提高了计算效率。通过本方法,可以让用户获得更加智能更加纯净的用户录制语音,并且迁移了录音室收音人后期的处理方案,将关键操作自动化,节省追求降噪效果的成本,并且用户可以更容易录制出表达清晰的语音,从而无需因为卡顿、音量问题而重复语音录制过程。
附图说明
[0034]图1为本专利技术实施例提供的一种语音处理方法的应用场景示意图;
[0035]图2为本专利技术实施例提供的一种语音处理方法的流程示意图;
[0036]图3为本专利技术实施例中提供的一种平均音素数量的获取步骤流程示意图;
[0037]图4为本专利技术实施例中平衡音量的方法流程示意图;
[0038]图5为本专利技术实施例提供的一种语音处理系统的结构示意图;
[0039]图6为本专利技术实施例提供的一种计算机设备的结构示意图。
[0040]本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0041]应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0042]图1为本专利技术实施例提供的一种语音处理方法的应用场景示意图,如图1所示,用户在客户端上传该用户录制语音,客户端接收到该用户录制语音后,将该用户录制语音发送给服务端,服务端接收到该用户录制语音后,执行该一种语音处理方法,对用户录制语音进行处理,得到平均化后的每帧语音。
[0043]需要说明的是,服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。客户端可为智能手机、平板电脑、笔记本电脑、台式计算机等,但并不局限于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音处理方法,其特征在于,包括:对初始用户录制语音进行压限处理,获取压限后的用户录制语音;对压限后的用户录制语音进行不完全降噪处理,获取降噪后的用户录制语音;对降噪后的用户录制语音进行消歧,获取消歧后的用户录制语音;根据所述初始用户录制语音的平均音素数量,调整消歧后的用户录制语音中预先分帧的每一帧语音中的因素个数,获取调整后的每一帧语音;根据所述初始用户录制语音的平均音量大小,对调整后的每一帧语音的音量进行平衡处理,获取平衡化后的每一帧语音,并输出平衡化后的每一帧语音。2.根据权利要求1所述的语音处理方法,其特征在于,所述对压限后的用户录制语音进行不完全降噪处理,获取降噪后的用户录制语音,包括:对压限后的用户录制语音进行降噪,使得降噪后的用户录制语音中噪声能量在压限后的用户录制语音中的噪声能量的预设比例范围之内。3.根据权利要求1所述的语音处理方法,其特征在于,所述对初始用户录制语音进行压限处理,获取压限后的用户录制语音,之前包括:对原始用户录制语音进行静音检测,移除所述原始用户录制语音中的空白语音,获取静音检测后的用户录制语音,并将静音检测后的用户录制语音重新作为所述初始用户录制语音。4.根据权利要求1所述的语音处理方法,其特征在于,所述平均音素数量通过如下方式获得:获取所述初始用户录制语音中的所有音素数量;根据所述初始用户录制语音的时长和所有音素数量,获取所述平均音素数量。5.根据权利要求1所述的语音处理方法,其特征在于,所述根据所述初始用户录制语音的平均音素数量,调整消歧后的用户录制语音中预先分帧的每一帧语音中的因素个数,获取调整后的每一帧语音,具体包括:根据所述平均因素数量,对消歧后的用户录制语音中预先分帧的每一帧语音中因素个数进行调整,使得调整后的每一帧语音的音素数量...

【专利技术属性】
技术研发人员:邓园旻邹昆伦
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1