语音处理方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:21915796 阅读:20 留言:0更新日期:2019-08-21 12:59
本申请实施例提供了一种语音处理方法、装置、计算机设备及计算机可读存储介质。本申请实施例属于语音识别技术领域,本申请实施例实现语音识别时,通过非流的方式,让人一次性录制完所有语音后,获取非流方式的语音,先判断语音中是否包含异常声音信号,异常声音信号包括静音期信号,若语音中包含异常声音信号,通过语音活动检测异常声音信号,然后对语音进行裁剪,删除异常声音信号,得到多个语音片段,将多个语音片段按照各自在语音中的原有顺序进行语音合成以得到新语音,然后再通过语音识别服务器对新语音进行整句识别的方式进行语音识别,以使整句形式的新语音可以有效利用语音识别中的声学模型和语言模型,有效提升语音的识别准确性和效率。

Speech Processing Method, Device, Computer Equipment and Storage Media

【技术实现步骤摘要】
语音处理方法、装置、计算机设备及存储介质
本申请涉及语音识别
,尤其涉及一种语音处理方法、装置、计算机设备及计算机可读存储介质。
技术介绍
在进行语音识别录制语音时,尤其当录制的语音较长时,录制语音的过程中会存在停顿的情况从而导致录制的语音中间存在空白期,获得的语音信号是不连续的,在语音识别时不能有效的利用语音识别的声学模型和语音模型,从而降低了语音识别的效率。比如,在一些业务场景中,经常需要验证身份证号,通过语音识别的方式提交身份证号是便利快捷的方式,但是由于身份证号长度较长,通常用户在读身份证号码的时候中间会出现间断,如果采集的音频以流的方式直接上传服务器识别,虽然可以实时出结果,但是却无法充分利用基于身份证号的声学模型和语言模型,并且容易出错,降低了身份证号码的语音识别效率。
技术实现思路
本申请实施例提供了一种语音处理方法、装置、计算机设备及计算机可读存储介质,能够解决传统技术中语音识别时效率低的问题。第一方面,本申请实施例提供了一种语音处理方法,所述方法包括:通过输入设备获取非流方式的语音;判断所述语音中是否包含异常声音信号,所述异常声音信号包括静音期信号;若所述语音中包含所述异常声音信号,通过语音活动检测对所述语音进行裁剪以删除所述异常声音信号,得到多个语音片段;将多个所述语音片段按照各自在所述语音中的原有顺序进行语音合成以得到新语音;对所述新语音进行语音识别。第二方面,本申请实施例还提供了一种语音处理装置,包括:获取单元,用于通过输入设备获取非流方式的语音;判断单元,用于判断所述语音中是否包含异常声音信号,所述异常声音信号包括静音期信号;裁剪单元,用于若所述语音中包含所述异常声音信号,通过语音活动检测对所述语音进行裁剪以删除所述异常声音信号,得到多个语音片段;合成单元,用于将多个所述语音片段按照各自在所述语音中的原有顺序进行语音合成以得到新语音;识别单元,用于对所述新语音进行语音识别。第三方面,本申请实施例还提供了一种计算机设备,其包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现所述语音处理方法。第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器执行所述语音处理方法。本申请实施例提供了一种语音处理方法、装置、计算机设备及计算机可读存储介质。本申请实施例实现语音识别时,通过非流的方式,让人一次性录制完所有语音后,获取非流方式的语音,先判断所述语音中是否包含异常声音信号,所述异常声音信号包括静音期信号,若所述语音中包含所述异常声音信号,通过语音活动检测所述异常声音信号,然后对语音进行裁剪,删除所述异常声音信号,得到多个语音片段,将多个所述语音片段按照各自在所述语音中的原有顺序进行语音合成以得到新语音,然后再通过语音识别服务器对新语音进行整句识别的方式进行语音识别,以使整句形式的新语音可以有效利用语音识别中的声学模型和语言模型,有效提升语音的识别准确性和效率。附图说明为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的语音处理方法的应用场景示意图;图2为本申请实施例提供的语音处理方法的流程示意图;图3为本申请实施例提供的语音处理方法中一个语音的波形图;图4为本申请实施例提供的语音处理方法中语音识别原理流程图;图5为本申请实施例提供的语音处理装置的示意性框图;图6为本申请实施例提供的语音处理装置的另一个示意性框图;以及图7为本申请实施例提供的计算机设备的示意性框图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。请参阅图1,图1为本申请实施例提供的语音处理方法的应用场景示意图。所述应用场景包括:(1)终端,终端也可以称为前端,终端上安装有麦克风等输入语音的组件以接收用户输入的语音,所述终端可以为笔记本电脑、智能手表、平板电脑或者台式电脑等电子设备,图1中的终端与服务器连接。(2)服务器,服务器主要进行语音识别,服务器可以为单台服务器、服务器集群或者云服务器,服务器若为服务器集群还可以包括主服务器和从服务器。请继续参阅图1,如图1所示,在本申请实施例中,主要以服务器端执行语音处理方法的步骤为例来解释本申请语音处理方法的技术方案,图1中的各个主体工作过程如下:终端通过语音输入设备接收用户输入的完整语音,并将语音发送至服务器以使服务器获取非流方式的语音;服务器判断所述语音中是否包含异常声音信号,所述异常声音信号包括静音期信号,若所述语音中包含所述异常声音信号,通过语音活动检测对所述语音进行裁剪以删除所述异常声音信号,得到多个语音片段,将多个所述语音片段按照各自在所述语音中的原有顺序进行语音合成以得到新语音,最后服务器对所述新语音进行语音识别以得到语音识别结果。需要说明的是,本申请实施例中的语音处理方法可以应用于终端,也可以应用于服务器,只要在服务器对语音进行识别前对语音进行处理即可。同时,本申请实施例中的语音处理方法的应用环境并不局限于图1所示的应用环境,也可以将语音处理方法及语音识别一起应用在终端等计算机设备中,只要在计算机设备进行语音识别前进行即可,上述语音处理方法的应用场景仅仅用于说明本申请技术方案,并不用于限定本申请技术方案,上述连接关系还可以有其他形式。图2为本申请实施例提供的语音处理方法的示意性流程图。该语音处理方法应用于图1中前端的计算机设备中,以完成语音处理方法的全部或者部分功能。请参阅图2,图2是本申请实施例提供的语音处理方法的流程示意图。如图2所示,该方法包括以下步骤S210-S250:S210、通过输入设备获取非流方式的语音。其中,流的方式是指语音识别设备实时获取语音所属的音频流,边获取所述音频流边进行语音识别。非流的方式,是指语音识别设备获取预设时间内的语音或者预设大小语音后,以整句或者整段语音的形式集中进行完整的语音识别。具体地,所述输入设备可以为终端,也可以为麦克风等语音输入组件,用户通过输入设备输入语音后,将整句或者整段的语音上传至服务器,从而服务器通本文档来自技高网...

【技术保护点】
1.一种语音处理方法,其特征在于,所述方法包括:通过输入设备获取非流方式的语音;判断所述语音中是否包含异常声音信号,所述异常声音信号包括静音期信号;若所述语音中包含所述异常声音信号,通过语音活动检测对所述语音进行裁剪以删除所述异常声音信号,得到多个语音片段;将多个所述语音片段按照各自在所述语音中的原有顺序进行语音合成以得到新语音;对所述新语音进行语音识别。

【技术特征摘要】
1.一种语音处理方法,其特征在于,所述方法包括:通过输入设备获取非流方式的语音;判断所述语音中是否包含异常声音信号,所述异常声音信号包括静音期信号;若所述语音中包含所述异常声音信号,通过语音活动检测对所述语音进行裁剪以删除所述异常声音信号,得到多个语音片段;将多个所述语音片段按照各自在所述语音中的原有顺序进行语音合成以得到新语音;对所述新语音进行语音识别。2.根据权利要求1所述语音处理方法,其特征在于,所述判断所述语音中是否包含异常声音信号的步骤之前,还包括:通过检测所述语音的音量大小以检测所述语音中是否包含声音;若所述语音中包含声音,判断所述语音中是否包含异常声音信号;若所述语音中未包含声音,输出重新输入语音的提示。3.根据权利要求1或者2所述语音处理方法,其特征在于,所述判断所述语音中是否包含异常声音信号的步骤包括:检测所述语音的音频波形中是否包含音频振幅小于第一预设阈值的波形;若所述音频波形中包含所述音频振幅小于所述第一预设阈值的波形,判定所述语音中包含所述异常声音信号。4.根据权利要求1所述语音处理方法,其特征在于,所述将多个所述语音片段按照各自在所述语音中的原有顺序进行语音合成以得到新语音的步骤包括:将多个所述语音片段按照各自在所述语音中的原有顺序进行语音的波形拼接以得到新语音。5.根据权利要求1所述语音处理方法,其特征在于,所述语音包含身份证号码,所述对所述新语音进行语音识别的步骤包括:对包含身份证号码的新语音进行语音识别;所述对所述新语音进行语音识别的步骤之后,还包括:根据预设的身份证号码编码规则校验所识别出的身份证号码是否包含错误;若所述身份证号码包含错误,对错误的所述身份证号码进行提示。6.根据权利要求5所述语音处理方法,其特征在于,所述根据预设的身份...

【专利技术属性】
技术研发人员:王涛
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1