音频语料自动标注方法、系统、介质和电子设备技术方案

技术编号：24498046 阅读：45 留言：0更新日期：2020-06-13 03:50

本发明专利技术公开了一种音频语料自动标注方法、系统、介质和电子设备，该方法包括：从一音频库里抓取一音频文件；转换所述音频文件的格式；通过VAD方法将所述音频文件切割为多个音频片段；调用语音识别API对多个音频片段进行识别，以获得一识别文本；抓取所述音频文件对应的原始文本，并将所述识别文本与所述原始文本进行对比，并根据对比的结果对所述音频文件进行标注。本方案能够自动切割音频，并对音频信号进行自动标注，能便利地运用到语音合成和自动语音识别的场景下。

Automatic annotation method, system, media and electronic equipment of audio corpus

全部详细技术资料下载

【技术实现步骤摘要】
音频语料自动标注方法、系统、介质和电子设备
本专利技术涉及一种音频语料自动标注方法、系统、介质和电子设备，隶属音频信号处理领域。
技术介绍
语言是人类思想最重要的载体，是人们交流最有效、最方便、最自然的方式。而说起人机交流的语言，主要分为语音识别和语音合成。语音识别技术是让机器接收、识别和理解语音信号，并将其转换成相应数字信号的技术；而语音合成技术，是赋予机器“人工嘴巴”的功能，解决的是如何让机器像人那样说话的问题。其中，语音合成的文语转换系统(TexttoSpeech，简称TTS)前期需要大量的语料去训练，音频切割标注就是为其服务的。现有技术中标注音频通常为人工标注，效率较低，不便于后期语音识别和语音合成的训练，亟需改进。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中人工标注音频使得效率低下的缺陷，提供一种音频语料自动标注方法、系统、介质和电子设备。本专利技术是通过下述技术方案来解决上述技术问题：一种音频语料自动标注方法，其特点在于，包括：S1、从...

【技术保护点】
1.一种音频语料自动标注方法，其特征在于，包括：/nS1、从一音频库里抓取一音频文件；/nS2、转换所述音频文件的格式；/nS3、通过VAD方法将所述音频文件切割为多个音频片段；/nS4、调用语音识别API对多个音频片段进行识别，以获得一识别文本；/nS5、抓取所述音频文件对应的原始文本，并将所述识别文本与所述原始文本进行对比，并根据对比的结果对所述音频文件进行标注。/n

【技术特征摘要】
1.一种音频语料自动标注方法，其特征在于，包括：
S1、从一音频库里抓取一音频文件；
S2、转换所述音频文件的格式；
S3、通过VAD方法将所述音频文件切割为多个音频片段；
S4、调用语音识别API对多个音频片段进行识别，以获得一识别文本；
S5、抓取所述音频文件对应的原始文本，并将所述识别文本与所述原始文本进行对比，并根据对比的结果对所述音频文件进行标注。

2.如权利要求1所述的音频语料自动标注方法，其特征在于，步骤S3和步骤S4之间包括：
S3a、判断所述音频片段的时长是否在一预设范围内，若是，则进入步骤S4；若否，则对该音频片段重新切割。

3.如权利要求1所述的音频语料自动标注方法，其特征在于，步骤S3包括：
S31、通过比较似然比的方法判断所述音频文件是否为语音，并对所述音频文件为语音以及为非语音的情形分别进行标注。

4.如权利要求1-3中任意一项所述的音频语料自动标注方法，其特征在于，步骤S5中将所述识别文本与所述原始文本进行...

【专利技术属性】
技术研发人员：袁鹏，江文斌，李健，
申请(专利权)人：上海携程国际旅行社有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人