一种语音处理方法及装置制造方法及图纸

技术编号：19829041 阅读：18 留言：0更新日期：2018-12-19 17:04

本发明专利技术提供了一种语音处理方法及装置，其中，该方法包括：通过端点检测将混合语音分割成N个语音片段，其中，所述N为大于或等于2的自然数；对所述N个语音片段中的任意相邻的两个语音片段进行贝叶斯信息准则BIC检测，并丢弃BIC检测出现异常的语音片段，得到目标对象的有效语音片段。通过本发明专利技术，可以解决相关技术中对于主要为特定目标说话的混合语音不能快速有效分离出特定目标语音的问题，实现了从混合语音中快速分离特定目标语音的效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音处理方法及装置
本专利技术涉及通信领域，具体而言，涉及一种语音处理方法及装置。
技术介绍
原有的基于贝叶斯信息准则BIC做说话人转折点检测的方案，以可分离为目的，一般最终是为了把多个说话人的混合语音分开。在技术上不会对转折点的位置进行假定，而且一般会尽可能保留不同说话人的语音数据。另外一般也不会单独使用此方法，比如计算不同数据分布之间的距离，以及聚类，等等。对于某种特定说话人的语音时长占优，其它人或者噪声的语音时长相对较低，并且对语音内容不太关心，更关心说话人特征的场合，提出了以可分离为目的的方案。对于这类问题，目前的解决方法复杂度高，而且效果不理想，缺乏成熟的解决方法。针对相关技术中对于主要为特定目标说话的混合语音不能快速有效分离出特定目标语音的问题，尚未提出解决方案。
技术实现思路
本专利技术实施例提供了一种语音处理方法及装置，以至少解决相关技术中对于主要为特定目标说话的混合语音不能快速有效分离出特定目标语音的问题。根据本专利技术的一个实施例，提供了一种语音处理方法，包括：通过端点检测将混合语音分割成N个语音片段，其中，所述N为大于或等于2的自然数；对所述N个语音片段中的任意相邻的两个语音片段进行贝叶斯信息准则BIC检测，并丢弃BIC检测出现异常的语音片段，得到目标对象的有效语音片段。可选地，所述对所述N个语音片段中的任意相邻的两个语音片段进行贝叶斯信息准则BIC检测，并丢弃BIC检测出现异常的语音片段包括：对所述N个语音片段中相邻的两个语音片段对进行BIC检测；判断BIC检测的两个语音片段是否出现异常；在判断结果为是的情况下，丢弃BIC检测出现异...

【技术保护点】
1.一种语音处理方法，其特征在于，包括：通过端点检测将混合语音分割成N个语音片段，其中，所述N为大于或等于2的自然数；对所述N个语音片段中的任意相邻的两个语音片段进行贝叶斯信息准则BIC检测，并丢弃BIC检测出现异常的语音片段，得到目标对象的有效语音片段。

【技术特征摘要】
1.一种语音处理方法，其特征在于，包括：通过端点检测将混合语音分割成N个语音片段，其中，所述N为大于或等于2的自然数；对所述N个语音片段中的任意相邻的两个语音片段进行贝叶斯信息准则BIC检测，并丢弃BIC检测出现异常的语音片段，得到目标对象的有效语音片段。2.根据权利要求1所述的方法，其特征在于，所述对所述N个语音片段中的任意相邻的两个语音片段进行贝叶斯信息准则BIC检测，并丢弃BIC检测出现异常的语音片段包括：对所述N个语音片段中相邻的两个语音片段对进行BIC检测；判断BIC检测的两个语音片段是否出现异常；在判断结果为是的情况下，丢弃BIC检测出现异常的两个语音片段；重复对余下的N-2个语音片段中相邻的两个语音片段进行BIC检测，丢弃BIC检测出现异常的两个语音片段，直到余下的相邻两个语音片段均未出现异常。3.根据权利要求2所述的方法，其特征在于，判断BIC检测的两个语音片段是否出现异常包括：判断所述两个语音片段之间的BIC值是否大于预定阈值；在判断结果为是的情况下，确定所述两个语音片段出现异常；在判断结果为否的情况下，确定所述两个语音片段正常。4.根据权利要求1至3中任一项所述的方法，其特征在于，对所述N个语音片段中的两个语音片段进行BIC检测包括：计算所述两个语音片段之间的BIC值；对所述BIC值进行归一化处理。5.根据权利要求1至3中任一项所述的方法，其特征在于，通过端点检测将混合语音分割成N个语音片段包括：获取所述混合语音中的静音段；去除所述静音段；根据所述静音段对所述...

【专利技术属性】
技术研发人员：邹新生，
申请(专利权)人：北京网众共创科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人