电话录音标注方法、系统、存储介质和电子设备技术方案

技术编号:24582647 阅读:48 留言:0更新日期:2020-06-21 01:20
本发明专利技术公开了一种电话录音标注方法、系统、存储介质和电子设备,该方法包括获取一电话录音的音频文件,并将所述音频文件进行通道分离和格式转换;将通道分离和格式转换后的所述音频文件以VAD方法切割为多个音频片段;调用语音识别接口将所述音频片段识别为文本;对所述文本进行纠错以生成一标注文件。实现了对录音数据的自动标注,减少了人工标注音频的时间,能更好地将标注的音频和文本运用到语音识别和语音合成的场景中。

Methods, systems, storage media and electronic equipment for telephone recording

【技术实现步骤摘要】
电话录音标注方法、系统、存储介质和电子设备
本专利技术涉及音频信号处理领域,尤其涉及电话录音标注方法、系统、存储介质和电子设备。
技术介绍
语言是人类思想最重要的载体,是人们交流最有效、最方便、最自然的方式。而说起人机交流的语言,主要分为语音识别和语音合成。语音识别技术是让机器接收、识别和理解语音信号,并将其转换成相应数字信号的技术;而语音合成技术,是赋予机器“人工嘴巴”的功能,解决的是如何让机器像人那样说话的问题。语音识别(AutomaticSpeechRecognition,简称ASR)和语音合成(TexttoSpeech,简称TTS)前期需要大量的语料去训练,音频切割和语料半自动标注就是为其服务的。现有技术中获得所述语料的方式为通过人工的方式进行音频的标注,进而制作录音数据集,效率较低,不便于后期语音识别和语音合成的训练,亟需改进。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中人工标注音频效率较低,而不便于后期语音识别和语音合成的训练的缺陷,提供一种电话录音标注方法、系统、存储介质和电子设备,使得切割的录音和半自动标注后的文本可以用于智能客服的语音识别和语音合成训练,从而能够达到自定义扩充智能客服的语音识别和语音合成训练测试样本集的效果。本专利技术是通过下述技术方案来解决上述技术问题:一种电话录音标注方法,其特点在于,包括以下步骤:S1、获取一电话录音的音频文件,并将所述音频文件进行通道分离和格式转换;S2、将通道分离和格式转换后的所述音频文件以VAD(VoiceActivityDetection,语音端点检测)方法切割为多个音频片段;S3、调用语音识别接口将所述音频片段识别为文本;S4、对所述文本进行纠错以生成一标注文件。较佳地,步骤S1包括:S11、将所述音频文件进行左声道和右声道的分离,并保存分离后的左声道音频数据和右声道音频数据;S12、转换所述左声道音频数据和所述右声道音频数据的采样频率、位宽和编码格式。较佳地,步骤S2包括:S21、初始化VAD的参数,所述参数包括帧长;S22、以自适应调节VAD的参数的方式对所述音频文件进行切割;S23、判断切割后的音频片段的时长是否在一时长阈值内,若是,则保存该音频片段;若否,则返回步骤S22。较佳地,步骤S2和步骤S3之间包括:S2a、筛选出音频分割段数不为0的录音数据。较佳地,步骤S3和步骤S4之间包括:S3a、筛选包含口语化文本的音频片段的数量为总音频片段数量的第一百分比、筛选包含数字文本但不包含口语化文本的音频片段的数量为总音频片段数量的第二百分比、筛选不包含口语化文本和数字文本的音频片段的数量为总音频片段数量的第三百分比;S3b、将筛选出的音频片段构成音频池。较佳地,步骤S4包括:S41、判断所述音频片段被识别的文本是否正确,若是,则保存该文本,若否,进入步骤S42;S42、判断所述文本对应的所述音频池中的所述音频片段是否为噪声,若是,将该音频片段标记为噪声;若否,修改该文本后保存。一种电话录音标注系统,其特点在于,包括:音频处理模块,用于获取一电话录音的音频文件,并将所述音频文件进行通道分离和格式转换的处理;切割模块,用于通过VAD方法对处理后的所述音频文件进行切割;语音识别模块,用于调用语音识别接口将所述音频片段识别为文本;纠错模块,用于对所述文本进行纠错以生成一标注文件。较佳地,所述音频处理模块包括:通道分离模块,用于将所述音频文件进行左声道和右声道的分离,并保存分离后的左声道音频数据和右声道音频数据;格式转换模块,用于转换所述左声道音频数据和所述右声道音频数据的采样频率、位宽和编码格式。较佳地,所述切割模块包括:初始化模块,用于初始化VAD的参数,所述参数包括帧长;调节模块,用于以自适应调节VAD的参数的方式对所述音频文件进行切割;判断模块,用于判断切割后的音频片段的时长是否在一时长阈值内,若是,则保存该音频片段;若否,调用所述调节模块。一种计算机可读存储介质,其上存储有计算机程序,其特点在于,所述计算机程序被处理器执行时实现如上所述的电话录音标注方法的步骤。一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其特点在于,所述处理器执行所述计算机程序时实现如上所述的电话录音标注方法的步骤。本专利技术的积极进步效果在于:本方案自动将录音文件分割成满足条件的音频片段,并将音频片段自动识别为文本,实现了对录音数据的自动标注,减少了人工标注音频的时间。之后再对文本进行纠错,以及噪音判断,能够提升后语音识别的性能,能更好地将标注的音频和文本运用到语音识别和语音合成的场景中。附图说明图1为本专利技术实施例1的电话录音标注方法流程图。图2为本专利技术实施例1的电话录音标注方法中步骤S23的流程图。图3为本专利技术实施例1的电话录音标注方法中筛选符合条件的语音段的流程图。图4为本专利技术实施例1的电话录音标注方法中步骤S4的流程图。图5为本专利技术实施例2的电话录音标注系统结构图。图6为本专利技术实施例4的电子设备的硬件结构示意图。具体实施方式下面通过实施例的方式进一步说明本专利技术,但并不因此将本专利技术限制在所述的实施例范围之中。实施例1本实施例涉及一种客服录音半自动标注方法,隶属音频信号处理领域,是属于音频信号预处理和标签处理阶段。主要采用了语音信号处理领域中的端点检测的方法,来找出长语音中的有效语音段,然后进行切割和语音识别,最后主观试听并修改识别有误的文本。而切割与标注好的音频既可以用于语音识别获知客服录音的内容,也可以用于语音合成的语料训练。语音合成之后的语音可以使得智能客服像人一样自然的发音,两者结合起来就可以用于一些企业内的客户服务中心、尤其是旅游服务中心的智能客服,可以降低大量的人工成本,大幅提升服务效率。本实施例主要应用于旅游产品中的客户服务中心,比如预定的订单确认,售后问题解决,目的是保证更好地服务客户,沟通客户,进而做到充分保障消费者的权益,为客户提供最满意的服务。一种电话录音标注方法,如图1所示,包括以下步骤:S1、获取一电话录音的音频文件,并将所述音频文件进行通道分离和格式转换;通道分离主要是对双通道客服录音数据进行分离,为了将音频文件精准的切割、以及准确的语音识别出文本,将所述音频文件进行左声道和右声道的分离,并保存分离后的左声道音频数据和右声道音频数据。其中,左声道是客户方的音频,右声道是客服方的音频。然后转换所述左声道音频数据和所述右声道音频数据的采样频率、位宽和编码格式。具体地,将分离得到的左右声道音频采样频率转换为16kHz,位宽转换为16bit,编码格式转换成PCM编码,得到符合语音本文档来自技高网...

【技术保护点】
1.一种电话录音标注方法,其特征在于,包括以下步骤:/nS1、获取一电话录音的音频文件,并将所述音频文件进行通道分离和格式转换;/nS2、将通道分离和格式转换后的所述音频文件以VAD方法切割为多个音频片段;/nS3、调用语音识别接口将所述音频片段识别为文本;/nS4、对所述文本进行纠错以生成一标注文件。/n

【技术特征摘要】
1.一种电话录音标注方法,其特征在于,包括以下步骤:
S1、获取一电话录音的音频文件,并将所述音频文件进行通道分离和格式转换;
S2、将通道分离和格式转换后的所述音频文件以VAD方法切割为多个音频片段;
S3、调用语音识别接口将所述音频片段识别为文本;
S4、对所述文本进行纠错以生成一标注文件。


2.如权利要求1所述的电话录音标注方法,其特征在于,步骤S1包括:
S11、将所述音频文件进行左声道和右声道的分离,并保存分离后的左声道音频数据和右声道音频数据;
S12、转换所述左声道音频数据和所述右声道音频数据的采样频率、位宽和编码格式。


3.如权利要求1所述的电话录音标注方法,其特征在于,步骤S2包括:
S21、初始化VAD的参数,所述参数包括帧长;
S22、以自适应调节VAD的参数的方式对所述音频文件进行切割;
S23、判断切割后的音频片段的时长是否在一时长阈值内,若是,则保存该音频片段;若否,则返回步骤S22。


4.如权利要求1所述的电话录音标注方法,其特征在于,步骤S2和步骤S3之间包括:
S2a、筛选出音频分割段数不为0的录音数据。


5.如权利要求1-4中任意一项所述的电话录音标注方法,其特征在于,步骤S3和步骤S4之间包括:
S3a、筛选包含口语化文本的音频片段的数量为总音频片段数量的第一百分比、筛选包含数字文本但不包含口语化文本的音频片段的数量为总音频片段数量的第二百分比、筛选不包含口语化文本和数字文本的音频片段的数量为总音频片段数量的第三百分比;
S3b、将筛选出的音频片段构成音频池。


6.如权利要求5所述的电话录音标注方法,其特征在于,步骤S4包括:
S41、判断所述音频...

【专利技术属性】
技术研发人员:袁鹏江文斌李健
申请(专利权)人:上海携程国际旅行社有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1