静音点检测方法及装置、存储介质、电子设备制造方法及图纸

技术编号:23559972 阅读:46 留言:0更新日期:2020-03-25 05:07
本公开涉及计算机技术领域,尤其涉及一种静音点检测方法及装置、存储介质、电子设备。该方法包括:在语音信息的频谱信息上获取多个检测窗口和各所述检测窗口的频谱信息;根据各所述检测窗口的频谱信息并基于一预测模型计算各所述检测窗口的静音分数,其中,所述预测模型为具有三层2D CNN、五层Bi‑GRU RNN以及一个全连接层的端到端神经网络;根据各所述检测窗口的静音分数并结合一预设分数确定静音窗口,并通过所述静音窗口确定静音点。本公开提高了静音点的检测准确率。

Mute point detection method and device, storage medium and electronic equipment

【技术实现步骤摘要】
静音点检测方法及装置、存储介质、电子设备
本公开涉及计算机
,尤其涉及一种静音点检测方法及装置、存储介质、电子设备。
技术介绍
语音识别是各行各业的客服智能质检的一个重要环节,传统的语音识别技术往往聚焦在如何提升字的识别的准确率。然而,语音识别的前处理对质检的整体效果有着重要的影响。例如,语音识别的前处理中语音切割对质检的角色识别有着重要的作用。在语音切割技技术中,准确的检测静音点是语音切割技术的一个重要步骤。传统的静音点的检测常采用基于统计分布的算法。然而,在基于统计分布的算法中需要语音信息的频谱信息符合正态分布,但是在实际情况中,用正态分布反应语音信息的频谱信息往往是不合适的,因此,采用上述算法无法准确的检测出静音点,此外,上述算法仅对每一帧进行独立处理,忽略了相邻帧之间的相关性,因此进一步的降低了检测静音点的准确率。综上所述,需要提供一种可准确的检测出静音点的静音点检测方法。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。专本文档来自技高网...

【技术保护点】
1.一种静音点检测方法,其特征在于,包括:/n在语音信息的频谱信息上获取多个检测窗口和各所述检测窗口的频谱信息;/n根据各所述检测窗口的频谱信息并基于一预测模型计算各所述检测窗口的静音分数,其中,所述预测模型为具有三层2D CNN、五层Bi-GRU RNN以及一个全连接层的端到端神经网络;/n根据各所述检测窗口的静音分数并结合一预设分数确定静音窗口,并通过所述静音窗口确定静音点。/n

【技术特征摘要】
1.一种静音点检测方法,其特征在于,包括:
在语音信息的频谱信息上获取多个检测窗口和各所述检测窗口的频谱信息;
根据各所述检测窗口的频谱信息并基于一预测模型计算各所述检测窗口的静音分数,其中,所述预测模型为具有三层2DCNN、五层Bi-GRURNN以及一个全连接层的端到端神经网络;
根据各所述检测窗口的静音分数并结合一预设分数确定静音窗口,并通过所述静音窗口确定静音点。


2.根据权利要求1所述的静音点检测方法,其特征在于,所述在语音信息的频谱信息上获取多个检测窗口和各所述检测窗口的频谱信息包括:
在所述语音信息的频谱信息上滑动一预设窗口以获取多个所述检测窗口和各所述检测窗口的频谱信息。


3.根据权利要求1所述的静音点检测方法,其特征在于,所述方法还包括:
获取所述语音信息,并通过一预设大小的傅里叶窗口按照一预设步长在所述语音信息上滑动,以得到所述语音信息的频谱信息。


4.根据权利要求1所述的静音点检测方法,其特征在于,所述方法还包括:根据所述端到端神经网络构建所述预测模型,其中:根据所述端到端神经网络构建所述预测模型包括:
获取多个语音信息样本,并将所述多个语音信息样本转化为多个频谱信息样本;
根据各所述频谱信息样本的文本信息对各所述频谱信息样本进行标注,以得到多个标注样本;
根据所述多个标注样本对所述端到端神经网络进行训练,以得到所述预测模型。


5.根据权利要求4所述的静音点检测方法,其特征在于,所述根据所述多个标注样本对所述端到端神经网络进行训练,以得到所述预测模型包括:
将所述多个标注样本划分为多个标注样本集合;
根据所述多个标注样本集合对所述端到端神经网络进行迭代训练,并获取每个迭代训练后的所述端到端神经网络的各参数的数值;
分别根据每个迭代训练后的所述端到端神经网络的各参数的数值并结合所述端到端神经网络生成多个端到端候选神经网络;
获取多个验证语音信息,并将所述多个验证语音信息转化为多个验证频谱信息;
根据所述多个验证频谱信息计算各所述端到端候选神经网络的准确度,并将所述准确度最高的所述端到端候选神经网络确定为所述预测模型。


6.根据权利要求1所述的静音点检测方法,其特征在于,所述根据各所述检测窗口的频谱信息并基于一预测模型计算各所述检测窗口的静音分数包括:
根据各所述检测窗口的频谱信息并...

【专利技术属性】
技术研发人员:李萧萧李俊玲
申请(专利权)人:北京京东金融科技控股有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1