一种语音处理方法及装置制造方法及图纸

技术编号：29493882 阅读：30 留言：0更新日期：2021-07-30 19:06

本发明专利技术实施例涉及语音处理技术领域，尤其涉及一种语音处理方法、装置、计算设备及计算机可读存储介质。包括：针对语音集中的任一第一语音文件，通过语音分析确定第一语音文件的第一有效语音；对各第一有效语音在各第一语音文件中的位置进行聚类，得到有效语音在语音文件中的k个预测位置；针对语音集中的任一第二语音文件，从第二语音文件在k个预测位置处的语音序列中，确定第二语音文件的第二有效语音。通过先对语音集中的一部分语音文件的有效语音所在的位置进行聚类，得到k个可能的预测位置，如此，针对剩下的语音文件，只需在这k个预测位置处进行判断即可，无需对再进行逐帧的语音分析，从而提高了提取有效语音的效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音处理方法及装置
本专利技术实施例涉及语音处理
，尤其涉及一种语音处理方法、装置、计算设备及计算机可读存储介质。
技术介绍
为了训练基于深度学习的语音识别声学模型，通常需要对大量的语音数据进行处理，其数据量是几十万甚至上百万的。在对语音处理的过程中，往往需要提取每个文件的有效语音，但是由于数据量巨大，提取有效语音的效率就极为重要。综上，目前亟需一种语音处理方法，用以解决现有的提取有效语音的工作量大，效率低的问题。
技术实现思路
本专利技术实施例提供一种语音处理方法，用以解决现有的提取有效语音的工作量大，效率低的问题。本专利技术实施例提供一种语音处理方法，包括：针对语音集中的任一第一语音文件，通过语音分析确定所述第一语音文件的第一有效语音；对各第一有效语音在各第一语音文件中的位置进行聚类，得到有效语音在语音文件中的k个预测位置；针对所述语音集中的任一第二语音文件，从所述第二语音文件在所述k个预测位置处的语音序列中，确定所述第二语音文件的第二有效语音。>通过先对语音集中的本文档来自技高网...

【技术保护点】
1.一种语音处理方法，其特征在于，包括：/n针对语音集中的任一第一语音文件，通过语音分析确定所述第一语音文件的第一有效语音；/n对各第一有效语音在各第一语音文件中的位置进行聚类，得到有效语音在语音文件中的k个预测位置；/n针对所述语音集中的任一第二语音文件，从所述第二语音文件在所述k个预测位置处的语音序列中，确定所述第二语音文件的第二有效语音。/n

【技术特征摘要】
1.一种语音处理方法，其特征在于，包括：
针对语音集中的任一第一语音文件，通过语音分析确定所述第一语音文件的第一有效语音；
对各第一有效语音在各第一语音文件中的位置进行聚类，得到有效语音在语音文件中的k个预测位置；
针对所述语音集中的任一第二语音文件，从所述第二语音文件在所述k个预测位置处的语音序列中，确定所述第二语音文件的第二有效语音。

2.如权利要求1所述的方法，其特征在于，还包括：
针对所述语音集中的任一语音文件，根据所述语音文件的起始语音序列或结尾语音序列确定所述语音文件的噪声语音；根据所述语音文件的有效语音和所述语音文件的噪声语音，确定所述语音文件的信噪比。

3.如权利要求1所述的方法，其特征在于，
通过语音分析确定所述第一语音文件的第一有效语音，包括：
通过对所述第一语音文件进行滑窗操作，得到每个滑窗的语音序列；
将能量最高的语音序列确定为所述第一语音文件的第一有效语音；所述能量最高的语音序列对应的滑窗为所述第一有效语音在所述第一语音文件中的位置。

4.如权利要求3所述的方法，其特征在于，
通过对所述第一语音文件进行滑窗操作，得到每个滑窗的语音序列，包括：
采用n种不同尺寸的滑窗对所述第一语音文件进行滑窗操作，得到每个滑窗的语音序列；
将能量最高的语音序列确定为所述第一语音文件的第一有效语音，包括：
针对任一种尺寸的滑窗，将能量最高的语音序列确定为所述第一语音文件的第一有效语音。

5.如权利要求3所述的方法，其特征在于，
通过如下方式确定每个滑窗的语音序列的能量：
根据第一滑窗的语音序列与第二滑窗的语音序列，通...

【专利技术属性】
技术研发人员：李程帅，孙进伟，徐涛，
申请(专利权)人：青岛信芯微电子科技股份有限公司，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人