语音检测方法、装置和电子设备制造方法及图纸

技术编号：26508339 阅读：26 留言：0更新日期：2020-11-27 15:36

本申请提供一种语音检测方法、装置和电子设备，属于语音检测技术领域。本申请提供的语音检测方法通过检测语音数据中的语音部分生成语音段，将语音段划分成多个语音子段，通过对所述多个语音子段中的说话人进行检测，根据检测结果初步确定每个语音子段中是否存在重叠音，之后再采用重叠音识别算法，对初步确定中难以确定是否存在重叠音的目标语音子段进行验证，验证是否存在重叠音；然后获取所述语音段中出现的所有重叠音部分的起止时间；通过上述方式，对语音段划分得到的每个语音子段中的说话人进行检测能够快速、精准的确定非重叠音部分，再对无法确定是否具有重叠音的部分即可能出现重叠音的部分进行验证，从而提高重叠音的检测效果。

全部详细技术资料下载

【技术实现步骤摘要】
语音检测方法、装置和电子设备
本申请涉及语音识别领域，尤其涉及一种语音检测方法、装置和电子设备。
技术介绍
语音识别技术已经越来越广泛的在各个领域得到应用，如智能家居、语音输入、自动生成字幕等，目前对单人语音的识别，已经能够达到比较高的准确率。然而，在相对复杂的语音环境中，如在多人举行会议的录音过程中，经常会有两个参会人一起同时说话时，他们两的语音被重叠的录制在一起，形成了重叠音；特别是，当两个人或多人发生争吵时，会存在大量的重叠语音。用现有的语音识别算法/模型对这些录音数据进行语音识别(将录音转换成文字)时，重叠语音的存在会严重影响语音识别的准确率。
技术实现思路
本申请提出了一种语音检测方法、装置和电子设备，以解决复杂语音环境中的语音检测问题，提高重叠音检测准确率。为了实现上述目的，本申请采用了如下方案：一方面，本申请实施例提供了一种语音检测方法，包括：获取待检测语音数据；检测出所述待检测语音数据中的语音部分，生成语音段；将所述语音段划分成多个语音子段；...

【技术保护点】
1.一种语音检测方法，其特征在于，包括：/n获取待检测语音数据；/n检测所述待检测语音数据中的语音部分，生成语音段；/n将所述语音段划分成多个语音子段；/n对所述多个语音子段中的说话人进行检测，得到检测结果；/n根据所述检测结果，初步确定每个语音子段中是否存在重叠音；/n采用重叠音识别算法，对初步确定中难以确定是否存在重叠音的目标语音子段进行验证，验证是否存在重叠音；/n获取所述语音段中出现的所有重叠音部分的起止时间。/n

【技术特征摘要】
1.一种语音检测方法，其特征在于，包括：
获取待检测语音数据；
检测所述待检测语音数据中的语音部分，生成语音段；
将所述语音段划分成多个语音子段；
对所述多个语音子段中的说话人进行检测，得到检测结果；
根据所述检测结果，初步确定每个语音子段中是否存在重叠音；
采用重叠音识别算法，对初步确定中难以确定是否存在重叠音的目标语音子段进行验证，验证是否存在重叠音；
获取所述语音段中出现的所有重叠音部分的起止时间。

2.根据权利要求1所述的语音检测方法，其特征在于，所述对所述多个语音子段中的说话人进行检测，得到检测结果包括：
将所述多个语音子段分别两两成组，生成语音子段组；
获取每个语音子段组中的两个语音子段的相似度得分；
根据所述相似度得分，区分每个所述语音子段中的说话人。

3.根据权利要求1所述的语音检测方法，其特征在于，所述根据所述检测结果，初步确定每个语音子段中是否存在重叠音包括：
当难以区分目标语音子段的说话人时，若所述目标语音子段的前相邻语音子段与后相邻语音子段的说话人相同，则确定目标语音子段中不存在重叠音。

4.根据权利要求3所述的语音检测方法，其特征在于，所述根据所述检测结果，初步确定每个语音子段中是否存在重叠音还包括：
若所述目标语音子段的前相邻语音子段与后相邻语音子段的说话人不同，则认为难以确定是否存在重叠音。

5.根据权利要求4所述的语音检测方法，其特征在于，所述根据所述检测结果，初步确定每个语音子段中是否存在重叠音还包括：
若两个相邻语音子段的说话人不同，则确定前一个语音子段的后一半为重叠音，后一个语音子段的前一半为重叠音。
...

【专利技术属性】
技术研发人员：刘建敏，
申请(专利权)人：北京奕斯伟计算技术有限公司，海宁奕斯伟集成电路设计有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人