语音端点检测数据的标注方法、装置、设备和介质制造方法及图纸

技术编号:34774579 阅读:17 留言:0更新日期:2022-08-31 19:43
本申请提供一种语音端点检测数据的标注方法、装置、设备和介质,涉及智能客服技术领域,该方法包括:获取语音数据,根据预设参数和脚本工具对语音数据进行自动标注,得到初始标注文件,根据预设筛查准则,在初始标注文件中筛查得到标注合格文件,将标注合格文件输入至标注工具进行校验,得到校验完成文件,将校验完成文件进行拆分,得到语音端点检测数据标注文件。该技术方案中,通过脚本工具和参数对语音进行初步标注。然后用标注筛查模块对标注质量进行筛查,对标注筛查合格之后的标注进行校验完成后,进行标注数据帧级别标注结果转换。不需要人工边听音频边进行人工手动标注,提升了标注的效率和质量。了标注的效率和质量。了标注的效率和质量。

【技术实现步骤摘要】
语音端点检测数据的标注方法、装置、设备和介质


[0001]本申请涉及智能客服
,尤其涉及一种语音端点检测数据的标注方法、装置、设备和介质。

技术介绍

[0002]智能客服系统是人工智能技术与传统金融业客服窗口相结合的产物,是指由智能机器人为客户提供智能引导、业务查询、业务办理以及客户投诉等不涉及到账户资金变动的非金融业务。智能客服系统的语音识别准确率直接影响用户的体验,而语音识别主要包括语音端点检测和语音识别两个部分,其中,语音端点检测需要依赖语音端点检测模型,通常会使用少量精标的训练数据来训练语音端点检测模型。
[0003]现有技术中,由于训练数据是帧级别的语音标注数据,在获取训练数据的过程中,通常是由具备比较专业的标注知识的标注人员仔细反复聆听语音并标注得到训练数据。
[0004]但是,现有的这种人工标注的方式由于标注数据量非常大,可能面临的是上千甚至上万级别的数据量,整个标注过程非常耗费人力成本,标注效率不高。

技术实现思路

[0005]本申请提供一种语音端点检测数据的标注方法、装置、设备和介质,用于解决现有语音端点检测数据的标注效率低的问题。
[0006]第一方面,本申请实施例提供一种语音端点检测数据的标注方法,包括:
[0007]获取语音数据,根据预设参数和脚本工具对所述语音数据进行自动标注,得到初始标注文件;
[0008]根据预设筛查准则,在所述初始标注文件中筛查得到标注合格文件;
[0009]将所述标注合格文件输入至标注工具进行校验,得到校验完成文件;
[0010]将所述校验完成文件进行拆分,得到语音端点检测数据标注文件。
[0011]在第一方面的一种可能设计中,所述获取语音数据,包括:
[0012]获取音频数据,在所述音频数据中筛选得到包含预设语音场景的至少一个目标音频数据;
[0013]将所述至少一个目标音频数据中静音时长超过预设静音时长和/或信噪比超过预设信噪比阈值的音频数据筛除,得到筛除后目标音频数据;
[0014]将所述筛除后目标音频数据中语音时长小于预设时长阈值的音频数据筛除,得到所述语音数据。
[0015]在第一方面的另一种可能设计中,所述根据预设参数和脚本工具对所述语音数据进行自动标注,得到初始标注文件,包括:
[0016]根据所述预设参数,确定所述脚本工具的语音指标,所述语音指标包括静音阈值、最小静音长度、最小语音长度中的至少一种;
[0017]根据所述语音指标,获取所述语音数据中的语音、所述语音的时间戳、非语音和所
述非语音的时间戳;
[0018]根据所述语音的时间戳和非语音的时间戳,获取所述初始标注文件。
[0019]在第一方面的再一种可能设计中,所述根据预设筛查准则,在所述初始标注文件中筛查得到标注合格文件,包括:
[0020]确定所述初始标注文件是否符合预设标注格式;
[0021]若所述初始标注文件符合预设标注格式,则检测所述初始标注文件的前端和末端是否为静音段;
[0022]若所述初始标注文件的前端和末端为静音段,则检测所述初始标注文件中语音时长和静音时长的比率是否大于预设比率;
[0023]若所述初始标注文件中语音时长和静音时长的比率大于预设比率,则确定所述初始标注文件为所述标注合格文件。
[0024]在第一方面的又一种可能设计中,所述方法还包括:
[0025]若所述初始标注文件不符合所述预设标注格式或前端和末端为非静音段或语音时长和静音时长的比率小于或等于所述预设比率,则确定所述初始标注文件为标注不合格文件;
[0026]根据所述标注不合格文件,对所述语音指标的值进行调整更新。
[0027]在第一方面的又一种可能设计中,所述将所述标注合格文件输入至标注工具进行校验,得到校验完成文件,包括:
[0028]将所述语音数据输入至标注工具,获取语谱波形图和频谱图的音强、音高、共振峰曲线;
[0029]根据所述语谱波形图和频谱图的音强、音高、共振峰曲线,确定所述语音数据的语音边界和非语音边界;
[0030]根据所述语音数据的语音边界和非语音边界,对所述标注合格文件进行校验,得到检验完成文件。
[0031]在第一方面的又一种可能设计中,所述将所述校验完成文件进行拆分,得到语音端点检测数据标注文件,包括:
[0032]获取所述校验完成文件中的语音段和非语音段;
[0033]根据预设时间间隔,对所述语音段和非语音段进行切分得到所述语音端点检测数据标注文件。
[0034]在第一方面的又一种可能设计中,所述方法还包括:
[0035]获取所述校验完成文件的总语音帧数;
[0036]确定所述校验完成文件的总语音帧数是否与目标帧数相同,所述目标帧数为所述语音端点检测数据标注文件的语音帧数;
[0037]若所述总语音帧数与所述目标帧数不同,则获取所述总语音帧数与所述目标帧数的差值;
[0038]将所述校验完成文件末端的语音帧复制添加差值数量份,添加至所述校验完成文件的末端。
[0039]第二方面,本申请实施例提供一种语音端点检测数据的标注装置,包括:
[0040]自动标注模块,用于获取语音数据,根据预设参数和脚本工具对所述语音数据进
行自动标注,得到初始标注文件;
[0041]标注筛查模块,用于根据预设筛查准则,在所述初始标注文件中筛查得到标注合格文件;
[0042]标注校验模块,用于将所述标注合格文件输入至标注工具进行校验,得到校验完成文件;
[0043]文件生成模块,用于将所述校验完成文件进行拆分,得到语音端点检测数据标注文件。
[0044]第三方面,本申请实施例提供一种计算机设备,包括:处理器,以及与所述处理器通信连接的存储器;
[0045]所述存储器存储计算机执行指令;
[0046]所述处理器执行所述存储器存储的计算机执行指令,以实现上述的方法。
[0047]第四方面,本申请实施例提供一种可读存储介质,所述可读存储介质中存储有计算机指令,所述计算机指令被处理器执行时用于实现上述的方法。
[0048]第五方面,本申请实施例提供一种程序产品,包括计算机指令,该计算机指令被处理器执行时实现上述的方法。
[0049]本申请实施例提供的音频端点数据标注方法、装置、设备、介质和程序产品,通过脚本工具和参数对语音进行初步标注。然后用标注筛查模块对标注质量进行筛查,对标注筛查合格之后的标注进行校验完成后,进行标注数据帧级别标注结果转换。不需要人工边听音频边进行人工手动标注,提升了标注的效率和质量。
附图说明
[0050]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理;
[0051]图1为本申请实施例提供的智能客服系统的场景示意图;
[0052]图2本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音端点检测数据的标注方法,其特征在于,所述方法包括:获取语音数据,根据预设参数和脚本工具对所述语音数据进行自动标注,得到初始标注文件;根据预设筛查准则,在所述初始标注文件中筛查得到标注合格文件;将所述标注合格文件输入至标注工具进行校验,得到校验完成文件;将所述校验完成文件进行拆分,得到语音端点检测数据标注文件。2.根据权利要求1所述的方法,其特征在于,所述获取语音数据,包括:获取音频数据,在所述音频数据中筛选得到包含预设语音场景的至少一个目标音频数据;将所述至少一个目标音频数据中静音时长超过预设静音时长和/或信噪比超过预设信噪比阈值的音频数据筛除,得到筛除后目标音频数据;将所述筛除后目标音频数据中语音时长小于预设时长阈值的音频数据筛除,得到所述语音数据。3.根据权利要求1所述的方法,其特征在于,所述根据预设参数和脚本工具对所述语音数据进行自动标注,得到初始标注文件,包括:根据所述预设参数,确定所述脚本工具的语音指标,所述语音指标包括语音强度和静音段检测参数中至少一种;根据所述语音指标,获取所述语音数据中的语音、所述语音的时间戳、非语音和所述非语音的时间戳;根据所述语音的时间戳和非语音的时间戳,获取所述初始标注文件。4.根据权利要求1所述的方法,其特征在于,所述根据预设筛查准则,在所述初始标注文件中筛查得到标注合格文件,包括:确定所述初始标注文件是否符合预设标注格式;若所述初始标注文件符合预设标注格式,则检测所述初始标注文件的前端和末端是否为静音段;若所述初始标注文件的前端和末端为静音段,则检测所述初始标注文件中语音时长和静音时长的比率是否大于预设比率;若所述初始标注文件中语音时长和静音时长的比率大于预设比率,则确定所述初始标注文件为所述标注合格文件。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:若所述初始标注文件不符合所述预设标注格式或前端和末端为非静音段或语音时长和静音时长的比率小于或等于所述预设比率,则确定所述初始标注文件为标注不合格文件;根据所述标注不合格文件,对语音指标的值进行调整更新。6.根据权利要求1所述的方法,其特征在于,所述将所述标注合格文件输入至标注工具进行...

【专利技术属性】
技术研发人员:王丽萍杨辰雨杨凯
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1