一种录制和处理训练语料的方法技术

技术编号:26893036 阅读:45 留言:0更新日期:2020-12-29 16:14
一种录制和处理训练语料的方法,包括如下步骤:S1在录音位的不同距离布置一组录音设施,同组的所述录音设施位于相对录音位的不同角度方位;S2开始录音,录音者按下前进键,按照命令词列表依序朗读命令词,每读完一个命令词,录音者按一次前进键;S3所有训练语料录音完成后,对得到的录制语料转化为统一格式;S4 转化为统一格式后,进行批量切分,将录制语料切分为多个命令词语料;切分的分割点为所述步骤S21中按下前进键的时间点;S5对命令词语料进行校验,剔除不合格的命令词语料。本发明专利技术通过对录音工艺流程的优化和改善、缩短了音频处理周期、降低了文本和训练切分的错误率,提高了工作效率。

【技术实现步骤摘要】
一种录制和处理训练语料的方法
本专利技术属于人工智能领域中的语音识别技术,涉及大批量语料的数据处理,具体涉及一种录制和处理训练语料的方法。
技术介绍
近几年,随着AI语音技术迅猛发展,声音作为语料的来源,在声学模型训练流程中至关重要,但目前,语料的录制和处理还存在很大的缺点,列如:录制训练语料时只能录制同一人次的单一音频,无法收集到同一人次多距离和多角度的音频,因此需要耗费大量的财力来找人录制足够多的训练语料。在录制时经常出现录音者读错命令词、按键过快以及回退等问题,导致生成的时间标签记录出错,从而在后续处理过程中产生许多问题音频,修改起来繁琐且耗时,导致大量的音频无法投入使用。在训练语料录制完成后,需要大量的人力来对音频进行手动对齐和手动切分的操作,不仅处理周期长、错误率高且效率低下。从训练语料录制到处理的整套流程中,现有方法已经无法满足使用者日益增长的需求。
技术实现思路
为克服现有技术存在的技术缺陷,本专利技术公开了一种录制和处理训练语料的方法。本专利技术所述录制和处理训练语料的方法,包括如下步骤:S1本文档来自技高网...

【技术保护点】
1.一种录制和处理训练语料的方法,其特征在于,包括如下步骤:/nS1在录音位的不同距离布置一组录音设施,同组的所述录音设施位于相对录音位的不同角度方位;每组录音设施包括至少一个高保真录音设备;/nS2开始录音,录音者进入录音位,系统调用训练语料并将其中的命令词列表显示在显示设备上,随后播报提示音;/nS21提示音播报完后,录音者按下前进键,按照命令词列表依序朗读命令词,每读完一个命令词,录音者按一次前进键;/nS22当前训练语料的全部命令词读完后,系统调用新的训练语料,并重新播报提示音,重复步骤S21;/nS3所有训练语料录音完成后,对得到的录制语料转化为统一格式;/nS4 转化为统一格式后,...

【技术特征摘要】
1.一种录制和处理训练语料的方法,其特征在于,包括如下步骤:
S1在录音位的不同距离布置一组录音设施,同组的所述录音设施位于相对录音位的不同角度方位;每组录音设施包括至少一个高保真录音设备;
S2开始录音,录音者进入录音位,系统调用训练语料并将其中的命令词列表显示在显示设备上,随后播报提示音;
S21提示音播报完后,录音者按下前进键,按照命令词列表依序朗读命令词,每读完一个命令词,录音者按一次前进键;
S22当前训练语料的全部命令词读完后,系统调用新的训练语料,并重新播报提示音,重复步骤S21;
S3所有训练语料录音完成后,对得到的录制语料转化为统一格式;
S4转化为统一格式后,进行批量切分,将录制语料切分为多个命令词语料;切分的分割点为所述步骤S21中按下前进键的时间点;
S5对命令词语料进行校验,剔除不合格的命令词语料。


2.如权利要求1所述的录制和处理训练语料的方法,其特征在于,所述步骤S4的批量切分具体为:
选取近距离的高保真录音设备录制的录制语料,根据该设备在音...

【专利技术属性】
技术研发人员:钟晓蝶许兵陈思应
申请(专利权)人:成都启英泰伦科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1