语音检测方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：28455826 阅读：27 留言：0更新日期：2021-05-15 21:19

本申请涉及一种语音检测方法、装置、计算机设备和存储介质。所述方法包括：获取待进行断句检测的目标语音数据；对所述目标语音数据进行语音帧划分，得到目标语音帧序列；提取所述目标语音帧序列中各个目标语音帧对应的声学特征，得到目标声学特征序列，所述目标声学特征序列包括各个所述目标语音帧分别对应的目标声学特征；将所述目标声学特征序列输入到端点检测模型中进行处理，得到端点检测值序列，所述端点检测值序列包括各个所述目标语音帧分别对应的端点检测值；根据所述端点检测值序列得到所述目标语音数据对应的语音端点。采用本方法能够提高语音检测准确度。用本方法能够提高语音检测准确度。用本方法能够提高语音检测准确度。

全部详细技术资料下载

【技术实现步骤摘要】
语音检测方法、装置、计算机设备和存储介质

[0001]本申请涉及语音处理
，特别是涉及一种语音检测方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着人机信息交互技术的不断发展，语音识别技术显示出其重要性。在语音识别系统中，语音端点检测(Voice Activity Detection，VAD)是语音识别中的关键技术之一，是语音分析、语音合成、语音编码、说话人识别中的一个重要环节。语音端点检测是指在连续声音信号中找出语音的断句点，通过语音端点检测可以判断用户说话是否出现真正的断句。语音端点检测的准确性，会直接影响到语音识别系统的性能。
[0003]在传统的语音端点检测方式中，主要是将静音时长与阈值进行比对，通过判断静音时长是否超过阈值，以此判断是否出现断句。例如，阈值可以设置为5秒，当检测到用户未说话的静音时长超过5秒时，则认为检测到语音端点，即用户说话出现断句。然而，经常出现语音端点检测错误的情况，即语音端点检测准确度低。

技术实现思路

[0004]基于此，有必要针对上述技术问题，提...

【技术保护点】

【技术特征摘要】
1.一种语音检测方法，其特征在于，所述方法包括：获取待进行断句检测的目标语音数据；对所述目标语音数据进行语音帧划分，得到目标语音帧序列；提取所述目标语音帧序列中各个目标语音帧对应的声学特征，得到目标声学特征序列，所述目标声学特征序列包括各个所述目标语音帧分别对应的目标声学特征；将所述目标声学特征序列输入到端点检测模型中进行处理，得到端点检测值序列，所述端点检测值序列包括各个所述目标语音帧分别对应的端点检测值；根据所述端点检测值序列得到所述目标语音数据对应的语音端点。2.根据权利要求1所述的方法，其特征在于，所述将所述目标声学特征序列输入到端点检测模型中进行处理，得到端点检测值序列包括：将所述目标声学特征序列输入到端点检测模型中，所述端点检测模型结合所述目标声学特征序列输出各个所述目标语音帧对应的端点检测概率；当所述目标语音帧对应的端点检测概率大于预设概率时，获取第一预设值作为端点检测值；将所述目标语音帧对应的端点检测值按照语音帧顺序组成端点检测值序列。3.根据权利要求2所述的方法，其特征在于，所述根据所述端点检测值序列得到所述目标语音数据对应的语音端点包括：获取所述端点检测值序列中，所述第一预设值的连续排列数量大于第一数量阈值的第一检测值区域；将所述第一检测值区域所对应的前向语音点作为所述目标语音数据对应的语音端点。4.根据权利要求3所述的方法，其特征在于，所述将所述目标声学特征序列输入到端点检测模型中进行处理，得到端点检测值序列还包括：当所述目标语音帧对应的端点检测概率小于预设概率时，获取第二预设值作为端点检测值；所述第一检测值区域所对应的前向语音点为语音结束点，所述根据所述端点检测值序列得到所述目标语音数据对应的语音端点还包括：获取所述端点检测值序列中，所述第二预设值的连续排列数量大于第二数量阈值的第二检测值区域，所述第一数量阈值大于所述第二数量阈值；将所述第二检测值区域所对应的检测区域语音点作为所述目标语音数据对应的语音起始点；从所述语音起始点开始，进入获取所述端点检测值序列中，所述第一预设值的连续排列数量大于第一数量阈值的第一检测值区域；将所述第一检测值区域所对应的前向语音点作为所述目标...

【专利技术属性】
技术研发人员：袁丁，周维聪，蒋志宇，刘云峰，
申请(专利权)人：深圳追一科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人