一种录制和处理训练语料的方法技术

技术编号：26893036 阅读：45 留言：0更新日期：2020-12-29 16:14

一种录制和处理训练语料的方法,包括如下步骤：S1在录音位的不同距离布置一组录音设施，同组的所述录音设施位于相对录音位的不同角度方位；S2开始录音，录音者按下前进键，按照命令词列表依序朗读命令词，每读完一个命令词，录音者按一次前进键；S3所有训练语料录音完成后，对得到的录制语料转化为统一格式；S4 转化为统一格式后，进行批量切分，将录制语料切分为多个命令词语料；切分的分割点为所述步骤S21中按下前进键的时间点；S5对命令词语料进行校验，剔除不合格的命令词语料。本发明专利技术通过对录音工艺流程的优化和改善、缩短了音频处理周期、降低了文本和训练切分的错误率，提高了工作效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种录制和处理训练语料的方法
本专利技术属于人工智能领域中的语音识别技术，涉及大批量语料的数据处理，具体涉及一种录制和处理训练语料的方法。
技术介绍
近几年，随着AI语音技术迅猛发展，声音作为语料的来源，在声学模型训练流程中至关重要，但目前，语料的录制和处理还存在很大的缺点，列如：录制训练语料时只能录制同一人次的单一音频，无法收集到同一人次多距离和多角度的音频，因此需要耗费大量的财力来找人录制足够多的训练语料。在录制时经常出现录音者读错命令词、按键过快以及回退等问题，导致生成的时间标签记录出错，从而在后续处理过程中产生许多问题音频，修改起来繁琐且耗时，导致大量的音频无法投入使用。在训练语料录制完成后，需要大量的人力来对音频进行手动对齐和手动切分的操作，不仅处理周期长、错误率高且效率低下。从训练语料录制到处理的整套流程中，现有方法已经无法满足使用者日益增长的需求。
技术实现思路
为克服现有技术存在的技术缺陷，本专利技术公开了一种录制和处理训练语料的方法。本专利技术所述录制和处理训练语料的方法,包括如下步骤：S1本文档来自技高网...

【技术保护点】
1.一种录制和处理训练语料的方法,其特征在于,包括如下步骤：/nS1在录音位的不同距离布置一组录音设施，同组的所述录音设施位于相对录音位的不同角度方位；每组录音设施包括至少一个高保真录音设备；/nS2开始录音，录音者进入录音位，系统调用训练语料并将其中的命令词列表显示在显示设备上，随后播报提示音；/nS21提示音播报完后，录音者按下前进键，按照命令词列表依序朗读命令词，每读完一个命令词，录音者按一次前进键；/nS22当前训练语料的全部命令词读完后，系统调用新的训练语料，并重新播报提示音，重复步骤S21；/nS3所有训练语料录音完成后，对得到的录制语料转化为统一格式；/nS4 转化为统一格式后，...

【技术特征摘要】
1.一种录制和处理训练语料的方法,其特征在于,包括如下步骤：
S1在录音位的不同距离布置一组录音设施，同组的所述录音设施位于相对录音位的不同角度方位；每组录音设施包括至少一个高保真录音设备；
S2开始录音，录音者进入录音位，系统调用训练语料并将其中的命令词列表显示在显示设备上，随后播报提示音；
S21提示音播报完后，录音者按下前进键，按照命令词列表依序朗读命令词，每读完一个命令词，录音者按一次前进键；
S22当前训练语料的全部命令词读完后，系统调用新的训练语料，并重新播报提示音，重复步骤S21；
S3所有训练语料录音完成后，对得到的录制语料转化为统一格式；
S4转化为统一格式后，进行批量切分，将录制语料切分为多个命令词语料；切分的分割点为所述步骤S21中按下前进键的时间点；
S5对命令词语料进行校验，剔除不合格的命令词语料。

2.如权利要求1所述的录制和处理训练语料的方法，其特征在于，所述步骤S4的批量切分具体为：
选取近距离的高保真录音设备录制的录制语料，根据该设备在音...

【专利技术属性】
技术研发人员：钟晓蝶，许兵，陈思应，
申请(专利权)人：成都启英泰伦科技有限公司，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人