【技术实现步骤摘要】
韵律标注数据质检方法、装置、计算机设备和存储介质
[0001]本申请涉及语音处理
,特别是涉及一种韵律标注数据质检方法、装置、计算机设备和存储介质。
技术介绍
[0002]语音合成技术(Test to Speech,TTS)技术是人机交互中不可或缺的模块之一。语音合成技术包含前端和后端两个模块。其中,前端用于对输入文本做分析,为后端模块提取必要的语言学信息。在前端模块对输入文本做分析的相关过程中,最重要的一个环节是韵律预测。韵律预测是指预测出输入文本的韵律信息,即所谓中文中的“抑扬顿挫”,韵律信息可以让最终合成的声音听起来流畅且自然。
[0003]韵律预测可以通过韵律模型来实现,韵律模型的训练需要用到大量的韵律标注数据。为了训练一个可用的韵律模型,需要至少几十万组的韵律标注数据。由发音人对给定文本进行朗读录音后,再由文本标注人员依照发音人的读音方式,在文本中标注出对应的韵律停顿信息,两者(即发音人朗读的语音数据和标注了韵律停顿信息的文本)构成一组用于训练模型的韵律标注数据。
[0004]由于对韵律停顿的感知是一个主观的感受,韵律停顿信息会因标注人员的不同而有所差异,为了保证标注的统一性和正确性,常规方法是在发音人和文本标注人员完成工作后安排第三人作为质检人员,来对语音数据和标注了韵律停顿信息的文本做一致性以及错误性检查。为了确保结果不因个人判断而偏离,可能还会安排第四人,第五人来做交叉多次质检以确保结果的一致性和正确性,如此产生的人力和时间消耗都是繁重的。
[0005]因此,如何提高韵律 ...
【技术保护点】
【技术特征摘要】
1.一种韵律标注数据质检方法,其特征在于,所述方法包括:获取目标韵律标注数据;所述目标韵律标注数据包括语音数据和预先标注有第一韵律信息的第一文本信息;对所述语音数据进行语音识别,得到所述语音数据的识别文本信息和声学特征信息;根据所述声学特征信息在所述识别文本信息中标注第二韵律信息,得到第二文本信息;比对所述第一文本信息和所述第二文本信息,得到所述第一韵律信息的位置错误率;根据所述第一韵律信息的位置错误率确定所述目标韵律标注数据的机器质量检验结果。2.如权利要求1所述的方法,其特征在于,所述声学特征信息包括时域特征信息和频域特征信息;根据所述声学特征信息在所述识别文本信息中标注第二韵律信息,包括:根据所述时域特征信息和频域特征信息确定所述语音数据中的静音位置和对应的静音持续时长;根据所述语音数据中的静音位置和对应的静音持续时长在所述识别文本信息中标注第二韵律信息。3.如权利要求1所述的方法,其特征在于,所述声学特征信息包括语速特征信息和语调特征信息;根据所述声学特征信息在所述识别文本信息中标注第二韵律信息,包括:根据所述语速特征信息和所述语调特征信息确定所述语音数据中的读音升降调节奏信息;根据所述读音升降调节奏信息在所述识别文本信息中标注第二韵律信息。4.如权利要求1所述的方法,其特征在于,所述目标韵律标注数据还包括所述语音数据对应的原始文本;根据所述声学特征信息在所述识别文本信息中标注第二韵律信息之前,所述方法还包括:对比所述原始文本和所述识别文本信息是否一致;若一致,确定执行所述根据所述声学特征信息在所述识别文本信息中标注第二韵律信息的操作;若不一致,确定所述目标韵律标注数据的机器质量检验结果为未通过机检。5.如权利要求1所述的方法,其特征在于,根据所述第一韵律信息的位置错误率确定所述目标韵律标注数据的机器质量检验结果,包括:判断所述第一韵律信息的位置错误率是否大于第一错误率阈值;若是,执行预设的机器复检操作以确定所述目标韵律标注数据的机器质量检验结果;若否,确定所述目标韵律标注数据的机器质量检验结果为通过机检;其中,所述机器复检操作包括:对所述识别文本信息进行句法分析,得到所述识别文本信息的句法特征信息;根据所述句法特征信息在所述识别文本信息中标注第三韵律信息,得到第三文本信息;
比对所述第一文本信息和所述第三文本信息,得到所述第一韵律信息的位置错误率;判断所述第一韵律信息的位置错误率是否大于第一错误率阈值;若是,确定所述目标韵律标注数据的机器质量检验结果为未通过机检;若否,确定所述目标韵律标注数据的机器质量检验结果为通过机检。6.如...
【专利技术属性】
技术研发人员:李洁琼,张人杰,丁雪枫,
申请(专利权)人:大众问问北京信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。