韵律标注数据质检方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:38866619 阅读:14 留言:0更新日期:2023-09-22 14:05
本申请涉及一种韵律标注数据质检方法、装置、计算机设备和存储介质。所述方法包括:获取目标韵律标注数据;目标韵律标注数据包括语音数据和预先标注有第一韵律信息的第一文本信息;对语音数据进行语音识别,得到语音数据的识别文本信息和声学特征信息;根据声学特征信息在识别文本信息中标注第二韵律信息,得到第二文本信息;比对第一文本信息和第二文本信息,得到第一韵律信息的位置错误率;根据第一韵律信息的位置错误率确定目标韵律标注数据的机器质量检验结果。本申请实施例能够实现对韵律标注数据进行自动化质检,提高了韵律标注数据的质检效率。数据的质检效率。数据的质检效率。

【技术实现步骤摘要】
韵律标注数据质检方法、装置、计算机设备和存储介质


[0001]本申请涉及语音处理
,特别是涉及一种韵律标注数据质检方法、装置、计算机设备和存储介质。

技术介绍

[0002]语音合成技术(Test to Speech,TTS)技术是人机交互中不可或缺的模块之一。语音合成技术包含前端和后端两个模块。其中,前端用于对输入文本做分析,为后端模块提取必要的语言学信息。在前端模块对输入文本做分析的相关过程中,最重要的一个环节是韵律预测。韵律预测是指预测出输入文本的韵律信息,即所谓中文中的“抑扬顿挫”,韵律信息可以让最终合成的声音听起来流畅且自然。
[0003]韵律预测可以通过韵律模型来实现,韵律模型的训练需要用到大量的韵律标注数据。为了训练一个可用的韵律模型,需要至少几十万组的韵律标注数据。由发音人对给定文本进行朗读录音后,再由文本标注人员依照发音人的读音方式,在文本中标注出对应的韵律停顿信息,两者(即发音人朗读的语音数据和标注了韵律停顿信息的文本)构成一组用于训练模型的韵律标注数据。
[0004]由于对韵律停顿的感知是一个主观的感受,韵律停顿信息会因标注人员的不同而有所差异,为了保证标注的统一性和正确性,常规方法是在发音人和文本标注人员完成工作后安排第三人作为质检人员,来对语音数据和标注了韵律停顿信息的文本做一致性以及错误性检查。为了确保结果不因个人判断而偏离,可能还会安排第四人,第五人来做交叉多次质检以确保结果的一致性和正确性,如此产生的人力和时间消耗都是繁重的。
[0005]因此,如何提高韵律标注数据的质检效率成为亟需解决的问题。

技术实现思路

[0006]本申请针对上述不足或缺点,提供了一种韵律标注数据质检方法、装置、计算机设备和存储介质,本申请实施例能够实现对韵律标注数据进行自动化质检,提高了韵律标注数据的质检效率。
[0007]本申请根据第一方面提供了一种韵律标注数据质检方法,在一些实施例中,该方法包括:
[0008]获取目标韵律标注数据;目标韵律标注数据包括语音数据和预先标注有第一韵律信息的第一文本信息;
[0009]对语音数据进行语音识别,得到语音数据的识别文本信息和声学特征信息;
[0010]根据声学特征信息在识别文本信息中标注第二韵律信息,得到第二文本信息;
[0011]比对第一文本信息和第二文本信息,得到第一韵律信息的位置错误率;
[0012]根据第一韵律信息的位置错误率确定目标韵律标注数据的机器质量检验结果。
[0013]在一些实施例中,声学特征信息包括时域特征信息和频域特征信息;
[0014]根据声学特征信息在识别文本信息中标注第二韵律信息,包括:
[0015]根据时域特征信息和频域特征信息确定语音数据中的静音位置和对应的静音持续时长;
[0016]根据语音数据中的静音位置和对应的静音持续时长在识别文本信息中标注第二韵律信息。
[0017]在一些实施例中,声学特征信息包括语速特征信息和语调特征信息;
[0018]根据声学特征信息在识别文本信息中标注第二韵律信息,包括:
[0019]根据语速特征信息和语调特征信息确定语音数据中的读音升降调节奏信息;
[0020]根据读音升降调节奏信息在识别文本信息中标注第二韵律信息。
[0021]在一些实施例中,目标韵律标注数据还包括语音数据对应的原始文本;
[0022]根据声学特征信息在识别文本信息中标注第二韵律信息之前,上述方法还包括:
[0023]对比原始文本和识别文本信息是否一致;
[0024]若一致,确定执行根据声学特征信息在识别文本信息中标注第二韵律信息的操作;
[0025]若不一致,确定目标韵律标注数据的机器质量检验结果为未通过机检。
[0026]在一些实施例中,根据第一韵律信息的位置错误率确定目标韵律标注数据的机器质量检验结果,包括:
[0027]判断第一韵律信息的位置错误率是否大于第一错误率阈值;
[0028]若是,执行预设的机器复检操作以确定目标韵律标注数据的机器质量检验结果;
[0029]若否,确定目标韵律标注数据的机器质量检验结果为通过机检;
[0030]其中,机器复检操作包括:
[0031]对识别文本信息进行句法分析,得到识别文本信息的句法特征信息;
[0032]根据句法特征信息在识别文本信息中标注第三韵律信息,得到第三文本信息;
[0033]比对第一文本信息和第三文本信息,得到第一韵律信息的位置错误率;
[0034]判断第一韵律信息的位置错误率是否大于第一错误率阈值;
[0035]若是,确定目标韵律标注数据的机器质量检验结果为未通过机检;
[0036]若否,确定目标韵律标注数据的机器质量检验结果为通过机检。
[0037]在一些实施例中,句法特征信息包括识别文本信息的短语结构信息和词语间依赖关系信息;
[0038]根据句法特征信息在识别文本信息中标注第三韵律信息,包括:
[0039]根据短语结构信息和词语间依赖关系信息分析得到识别文本信息的语法结构信息;
[0040]根据语法结构信息在识别文本信息中标注第三韵律信息。
[0041]在一些实施例中,目标韵律标注数据是需要质检的一批韵律标注数据中的任一条韵律标注数据;
[0042]根据声学特征信息在识别文本信息中标注第二韵律信息,得到第二文本信息之前,上述方法还包括:
[0043]获取该批韵律标注数据当前的整体错误率;
[0044]判断该批韵律标注数据当前的整体错误率是否大于第二错误率阈值;
[0045]若是,确定执行预设的机器复检操作;
[0046]若否,确定执行根据声学特征信息在识别文本信息中标注第二韵律信息,得到第二文本信息的操作。
[0047]在一些实施例中,对语音数据进行语音识别之前,上述方法还包括:
[0048]对第一文本信息进行句子语义困惑度分析,得到第一文本信息的语句合理度评估值;
[0049]判断语句合理度评估值是否超过预设评估值;
[0050]若是,确定目标韵律标注数据的机器质量检验结果为未通过机检;
[0051]若否,确定执行对语音数据进行语音识别的操作。
[0052]在一些实施例中,上述方法还包括:
[0053]响应于目标韵律标注数据的机器质量检验结果为未通过机检,对目标韵律标注数据进行人工复检。
[0054]本申请根据第二方面提供了一种韵律标注数据质检装置,在一些实施例中,该装置包括:
[0055]数据获取模块,用于获取目标韵律标注数据;目标韵律标注数据包括语音数据和预先标注有第一韵律信息的第一文本信息;
[0056]语音识别模块,用于对语音数据进行语音识别,得到语音数据的识别文本信息和声学特征信息;
[0057]标注模块,用于根据声学特征信息在识别文本信息中标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种韵律标注数据质检方法,其特征在于,所述方法包括:获取目标韵律标注数据;所述目标韵律标注数据包括语音数据和预先标注有第一韵律信息的第一文本信息;对所述语音数据进行语音识别,得到所述语音数据的识别文本信息和声学特征信息;根据所述声学特征信息在所述识别文本信息中标注第二韵律信息,得到第二文本信息;比对所述第一文本信息和所述第二文本信息,得到所述第一韵律信息的位置错误率;根据所述第一韵律信息的位置错误率确定所述目标韵律标注数据的机器质量检验结果。2.如权利要求1所述的方法,其特征在于,所述声学特征信息包括时域特征信息和频域特征信息;根据所述声学特征信息在所述识别文本信息中标注第二韵律信息,包括:根据所述时域特征信息和频域特征信息确定所述语音数据中的静音位置和对应的静音持续时长;根据所述语音数据中的静音位置和对应的静音持续时长在所述识别文本信息中标注第二韵律信息。3.如权利要求1所述的方法,其特征在于,所述声学特征信息包括语速特征信息和语调特征信息;根据所述声学特征信息在所述识别文本信息中标注第二韵律信息,包括:根据所述语速特征信息和所述语调特征信息确定所述语音数据中的读音升降调节奏信息;根据所述读音升降调节奏信息在所述识别文本信息中标注第二韵律信息。4.如权利要求1所述的方法,其特征在于,所述目标韵律标注数据还包括所述语音数据对应的原始文本;根据所述声学特征信息在所述识别文本信息中标注第二韵律信息之前,所述方法还包括:对比所述原始文本和所述识别文本信息是否一致;若一致,确定执行所述根据所述声学特征信息在所述识别文本信息中标注第二韵律信息的操作;若不一致,确定所述目标韵律标注数据的机器质量检验结果为未通过机检。5.如权利要求1所述的方法,其特征在于,根据所述第一韵律信息的位置错误率确定所述目标韵律标注数据的机器质量检验结果,包括:判断所述第一韵律信息的位置错误率是否大于第一错误率阈值;若是,执行预设的机器复检操作以确定所述目标韵律标注数据的机器质量检验结果;若否,确定所述目标韵律标注数据的机器质量检验结果为通过机检;其中,所述机器复检操作包括:对所述识别文本信息进行句法分析,得到所述识别文本信息的句法特征信息;根据所述句法特征信息在所述识别文本信息中标注第三韵律信息,得到第三文本信息;
比对所述第一文本信息和所述第三文本信息,得到所述第一韵律信息的位置错误率;判断所述第一韵律信息的位置错误率是否大于第一错误率阈值;若是,确定所述目标韵律标注数据的机器质量检验结果为未通过机检;若否,确定所述目标韵律标注数据的机器质量检验结果为通过机检。6.如...

【专利技术属性】
技术研发人员:李洁琼张人杰丁雪枫
申请(专利权)人:大众问问北京信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1