一种语音处理方法及装置制造方法及图纸

技术编号:19829041 阅读:18 留言:0更新日期:2018-12-19 17:04
本发明专利技术提供了一种语音处理方法及装置,其中,该方法包括:通过端点检测将混合语音分割成N个语音片段,其中,所述N为大于或等于2的自然数;对所述N个语音片段中的任意相邻的两个语音片段进行贝叶斯信息准则BIC检测,并丢弃BIC检测出现异常的语音片段,得到目标对象的有效语音片段。通过本发明专利技术,可以解决相关技术中对于主要为特定目标说话的混合语音不能快速有效分离出特定目标语音的问题,实现了从混合语音中快速分离特定目标语音的效果。

【技术实现步骤摘要】
一种语音处理方法及装置
本专利技术涉及通信领域,具体而言,涉及一种语音处理方法及装置。
技术介绍
原有的基于贝叶斯信息准则BIC做说话人转折点检测的方案,以可分离为目的,一般最终是为了把多个说话人的混合语音分开。在技术上不会对转折点的位置进行假定,而且一般会尽可能保留不同说话人的语音数据。另外一般也不会单独使用此方法,比如计算不同数据分布之间的距离,以及聚类,等等。对于某种特定说话人的语音时长占优,其它人或者噪声的语音时长相对较低,并且对语音内容不太关心,更关心说话人特征的场合,提出了以可分离为目的的方案。对于这类问题,目前的解决方法复杂度高,而且效果不理想,缺乏成熟的解决方法。针对相关技术中对于主要为特定目标说话的混合语音不能快速有效分离出特定目标语音的问题,尚未提出解决方案。
技术实现思路
本专利技术实施例提供了一种语音处理方法及装置,以至少解决相关技术中对于主要为特定目标说话的混合语音不能快速有效分离出特定目标语音的问题。根据本专利技术的一个实施例,提供了一种语音处理方法,包括:通过端点检测将混合语音分割成N个语音片段,其中,所述N为大于或等于2的自然数;对所述N个语音片段中的任意相邻的两个语音片段进行贝叶斯信息准则BIC检测,并丢弃BIC检测出现异常的语音片段,得到目标对象的有效语音片段。可选地,所述对所述N个语音片段中的任意相邻的两个语音片段进行贝叶斯信息准则BIC检测,并丢弃BIC检测出现异常的语音片段包括:对所述N个语音片段中相邻的两个语音片段对进行BIC检测;判断BIC检测的两个语音片段是否出现异常;在判断结果为是的情况下,丢弃BIC检测出现异常的两个语音片段;重复对余下的N-2个语音片段中相邻的两个语音片段进行BIC检测,丢弃BIC检测出现异常的两个语音片段,直到余下的相邻两个语音片段均未出现异常。可选地,判断BIC检测的两个语音片段是否出现异常包括:判断所述两个语音片段之间的BIC值是否大于预定阈值;在判断结果为是的情况下,确定所述两个语音片段出现异常;在判断结果为否的情况下,确定所述两个语音片段正常。可选地,所述对所述N个语音片段中的两个语音片段进行贝叶斯信息准则BIC检测,并丢弃BIC检测出现异常的语音片段包括:对所述N个语音片段中的语音片段对进行BIC检测,其中,所述语音片段对是所述N个语音片段中的两个语音片段;判断BIC检测的语音片段对是否出现异常,得到检测结果;丢弃所述检测结果为异常的语音片段对。可选地,判断BIC检测的语音片段对是否出现异常包括:判断语音片段对的BIC值是否大于预定阈值;在判断结果为是的情况下,确定所述语音片段对出现异常;在判断结果为否的情况下,确定所述语音片段对正常。可选地,对所述N个语音片段中的两个语音片段进行BIC检测包括:计算两个语音片段之间的BIC值;对所述BIC值进行归一化处理。可选地,通过端点检测将混合语音分割成N个语音片段包括:获取所述混合语音中的静音段;去除所述静音段;根据所述静音段对所述混合语音进行分割,得到分割后的长语音片段;通过端点检测将所述长语音片段分割成所述N个语音片段。根据本专利技术的又一个实施例,还提供了一种语音处理装置,包括:分割模块,用于通过端点检测将混合语音分割成N个语音片段,其中,所述N为大于或等于2的自然数;检测模块,用于对所述N个语音片段中的任意相邻的两个语音片段进行贝叶斯信息准则BIC检测,并丢弃BIC检测出现异常的语音片段,得到目标对象的有效语音片段。可选地,所述检测模块包括:检测单元,用于对所述N个语音片段中相邻的两个语音片段对进行BIC检测;判断单元,用于判断BIC检测的两个语音片段是否出现异常;丢弃单元,用于在判断结果为是的情况下,丢弃BIC检测出现异常的两个语音片段;重复检测单元,用于重复对余下的N-2个语音片段中相邻的两个语音片段进行BIC检测,丢弃BIC检测出现异常的两个语音片段,直到余下的相邻两个语音片段均未出现异常。可选地,所述判断单元,还用于判断所述两个语音片段之间的BIC值是否大于预定阈值;在判断结果为是的情况下,确定所述两个语音片段出现异常;在判断结果为否的情况下,确定所述两个语音片段正常。可选地,所述检测模块包括:计算单元,用于计算两个语音片段之间的BIC值;处理单元,用于对所述BIC值进行归一化处理。可选地,所述分割模块包括:获取单元,用于获取所述混合语音中的静音段;去除单元,用于去除所述静音段;第一分割单元,用于根据所述静音段对所述混合语音进行分割,得到分割后的长语音片段;第二分割单元,用于通过端点检测将所述长语音片段分割成所述N个语音片段。根据本专利技术的又一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。根据本专利技术的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。通过本专利技术,通过端点检测将混合语音分割成N个语音片段,其中,所述N为大于或等于2的自然数;对所述N个语音片段中的任意相邻的两个语音片段进行贝叶斯信息准则BIC检测,并丢弃BIC检测出现异常的语音片段,得到目标对象的有效语音片段,因此,可以解决相关技术中对于主要为特定目标说话的混合语音不能快速有效分离出特定目标语音的问题,实现了从混合语音中快速分离特定目标语音的效果。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是本专利技术实施例的一种语音处理方法的移动终端的硬件结构框图;图2是根据本专利技术实施例的一种语音处理方法的流程图;图3是根据本专利技术实施例的一种语音处理装置的框图;图4是根据本专利技术优选实施例的一种语音处理装置的框图一;图5是根据本专利技术优选实施例的一种语音处理装置的框图二。具体实施方式下文中将参考附图并结合实施例来详细说明本专利技术。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。实施例1本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本专利技术实施例的一种语音处理方法的移动终端的硬件结构框图,如图1所示,移动终端10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本专利技术实施例中的报文接收方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种本文档来自技高网...

【技术保护点】
1.一种语音处理方法,其特征在于,包括:通过端点检测将混合语音分割成N个语音片段,其中,所述N为大于或等于2的自然数;对所述N个语音片段中的任意相邻的两个语音片段进行贝叶斯信息准则BIC检测,并丢弃BIC检测出现异常的语音片段,得到目标对象的有效语音片段。

【技术特征摘要】
1.一种语音处理方法,其特征在于,包括:通过端点检测将混合语音分割成N个语音片段,其中,所述N为大于或等于2的自然数;对所述N个语音片段中的任意相邻的两个语音片段进行贝叶斯信息准则BIC检测,并丢弃BIC检测出现异常的语音片段,得到目标对象的有效语音片段。2.根据权利要求1所述的方法,其特征在于,所述对所述N个语音片段中的任意相邻的两个语音片段进行贝叶斯信息准则BIC检测,并丢弃BIC检测出现异常的语音片段包括:对所述N个语音片段中相邻的两个语音片段对进行BIC检测;判断BIC检测的两个语音片段是否出现异常;在判断结果为是的情况下,丢弃BIC检测出现异常的两个语音片段;重复对余下的N-2个语音片段中相邻的两个语音片段进行BIC检测,丢弃BIC检测出现异常的两个语音片段,直到余下的相邻两个语音片段均未出现异常。3.根据权利要求2所述的方法,其特征在于,判断BIC检测的两个语音片段是否出现异常包括:判断所述两个语音片段之间的BIC值是否大于预定阈值;在判断结果为是的情况下,确定所述两个语音片段出现异常;在判断结果为否的情况下,确定所述两个语音片段正常。4.根据权利要求1至3中任一项所述的方法,其特征在于,对所述N个语音片段中的两个语音片段进行BIC检测包括:计算所述两个语音片段之间的BIC值;对所述BIC值进行归一化处理。5.根据权利要求1至3中任一项所述的方法,其特征在于,通过端点检测将混合语音分割成N个语音片段包括:获取所述混合语音中的静音段;去除所述静音段;根据所述静音段对所述...

【专利技术属性】
技术研发人员:邹新生
申请(专利权)人:北京网众共创科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1