音频数据的采集方法及系统技术方案

技术编号:20625983 阅读:26 留言:0更新日期:2019-03-20 16:01
本发明专利技术公开一种音频数据的采集方法及系统包括:步骤S101,设置语音任务信息;所述语音任务信息中包括:语音任务标识及录音任务文本。步骤S102,根据所述设置语音任务的语音任务标识获取当前录音音频。步骤S103,对所述当前录音音频进行语音识别,获取当前录音文本。步骤S104,若所述当前录音文本与所述录音任务文本匹配,则对所述当前录音音频进行采集。本申请通过对录音内容进行识别,自动录音音频信息进行了审核,考虑到方言等语言偏差所造成的不能实现审核的因素,本发明专利技术中还采用通过对汉语拼音进行辅助识别的方式,对音频录音进行审核,不仅提高了录音音频采集的准确性,同时也提高了录音音频采集的效率。

Audio Data Acquisition Method and System

The present invention discloses an audio data acquisition method and system, which includes: 1) setting up voice task information, and the voice task information includes: voice task identification and recording task text. According to the voice task identification of the set voice task, the current recorded audio is acquired in Fig. 102. The current recorded audio is recognized by speech recognition to obtain the current recorded text. If the current recording text matches the recording task text, the current recording audio is collected. In this application, audio recordings are audited automatically by identifying the contents of the recordings. Considering the factors that can not be audited due to language deviation such as dialect, the method of auxiliary recognition of Chinese phonetic alphabet is also adopted in the present invention to audit the audio recordings, which not only improves the accuracy of audio recordings collection, but also improves the audio recordings collection. Efficiency.

【技术实现步骤摘要】
音频数据的采集方法及系统
本专利技术属于音频信息的处理及应用的
,尤其涉及音频数据的采集方法及系统。
技术介绍
采集音频数据的产品有各类付费录音采集app的录音技术及天猫精灵等智能语音产品的语音识别技术。音频数据是语音技术研究的重要生产资料。合法采集录音数据,通常的做法有两个,一个通过寻找固定群体,提供录音app和相应的文本,用户按照要求录音完成并人工审核通过后获取一定的酬劳。另一种类似于天猫精灵,通过语音识别与用户交互,并采集分析用户音频数据。付费录音采集app,需要人工审核录音,数据采集样本少,周期长。智能语音产品的语音识别,采用通用语音识别技术,且样本随机性高,无法按要求采集精准音频数据(如采集语音:你好小驰,需要快速和慢速各十遍)。付费录音app,只有录音技术,没有语音识别自动审核当前录音的准确度。智能语音产品的语音识别,是通用的语音识别技术,无法针对特定关键字的语音识别结果,进行审核,并实时调整通过率。本行业从业人员为解决这些缺陷,采取的是结合录音app和语音交互产品的特点,通过语音技能或者游戏的方式,引导用户说出想要的关键字,但是如果一旦用户故意说错或者环境嘈杂,即使音频质量不合格,也无法纠错,让用户重新录音,否则容易使用户失去兴趣。这种方式虽然在录音效率和录音质量上有所平衡,但音频质量仍然不能很好的达到训练所需标准。我们根据过去的经验,放弃利用语音交互产品大规模采集音频的方法,用新的角度,结合录音app录音精准的优点,改进了人工审核效率低的问题。
技术实现思路
本专利技术实施例提供一种音频数据的采集方法及系统,用于至少解决上述技术问题之一。第一方面,本专利技术实施例提供了一种音频数据的采集方法,所述方法包括:步骤S101,设置语音任务信息;所述语音任务信息中包括:语音任务标识及录音任务文本;步骤S102,根据所述设置语音任务的语音任务标识获取当前录音音频;步骤S103,对所述当前录音音频进行语音识别,获取当前录音文本;步骤S104,若所述当前录音文本与所述录音任务文本匹配,则对所述当前录音音频进行采集。基于所述语音任务信息中包括口音类型信息;所述口音类型信息包括:方言信息及普通话信息。基于所述步骤S101中还包括:根据所述录音文本及方言类型获取所述录音文本对应的汉语拼音序列。基于所述步骤S103中还包括:对所述当前录音音频进行语音识别,获取当前录音汉语拼音序列。基于,所述步骤S104中还包括:若当前录音汉语拼音序列与所述录音文本对应的汉语拼音序列匹配,则对所述当前录音音频进行采集。基于所述步骤S104中还包括:生成用户记录信息,所述用户记录信息中包括,录音采集信息、客户奖励信息。基于所述步骤S104中还包括:若当前录音文本与所述录音任务文本不匹配,则生成重录信息。第二方面,本专利技术实施例提供一种音频数据的采集系统,包括:设置语音任务单元、当前录音音频获取单元、当前录音文本获取单元及音频采集单元,其中,所述设置语音任务单元,配置为设置语音任务信息;所述语音任务信息中包括:语音任务标识及录音任务文本;所述当前录音音频获取单元,配置为根据所述设置语音任务单元获取的所述设置语音任务的语音任务标识获取当前录音音频;所述当前录音文本获取单元,配置为对所述当前录音音频获取单元中所获取的所述当前录音音频进行语音识别,获取当前录音文本;音频采集单元,配置为若所述当前录音文本获取单元中获取的所述前录音文本与所述录音任务文本匹配,则对所述当前录音音频进行采集。在一种优选的实施方式中,所述语音任务信息中包括口音类型信息;所述口音类型信息包括:方言信息及普通话信息。在一种优选的实施方式中,所述设置语音任务单元,还配置为根据所述录音文本及方言类型获取所述录音文本对应的汉语拼音序列。所述当前录音文本获取单元,还配置为若当前录音汉语拼音序列与所述录音文本对应的汉语拼音序列匹配,则对所述当前录音音频进行采集。第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例的方法的步骤。第四方面,本专利技术实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行本专利技术任一实施例的方法的步骤。本申请通过对录音内容进行识别,自动录音音频信息进行了审核,考虑到方言等语言偏差所造成的不能实现审核的因素,本专利技术中还采用通过对汉语拼音进行辅助识别的方式,对音频录音进行审核,不仅提高了录音音频采集的准确性,同时也提高了录音音频采集的效率。因此,本专利技术不仅能获得较高质量的特定文本,还能快速分享传播,加快了采集音频数据的速度。还可进行自由分享之后,采集的样本形态非常丰富,提高了后期的模型训练的可靠性。同时录音数据实时上传到大数据部门存储调用,极大的提高了研究的进度,提高技术体系升级的速度。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例提供的一种音频数据的采集方法的流程图。图2为本专利技术一实施例提供的另一种音频数据的采集系统的组成图。图3为本专利技术一实施例提供的又一种音频数据的采集方法的流程图。图4为专利技术一实施例提供的电子设备的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参考图1,为音频数据的采集方法流程示意图,所述方法包括:步骤S101,设置语音任务。本步骤中,设置语音任务信息;所述语音任务信息中包括:语音任务标识及录音任务文本。上述语音任务信息中包括口音类型信息;所述口音类型信息包括:方言信息及普通话信息。为便于通过拼音及方言进行辅助的音频判断,在本专利技术的一种实施方式中所述步骤S101中还包括:根据所述录音文本及方言类型获取所述录音文本对应的汉语拼音序列。在本步骤中,语音采集方登录管理后台,创建新的录音任务,该任务不能已上线的其他任务重名。根据近期研究需要,设置录音文本及每个文本需要录音的数量,选择需要的方言,默认为普通话。如果需要放宽录音要求,可以设置文本对应的拼音,即使语音识别返回的文本不同,但拼音相同,仍视为录音通过。拼音如果设置了多音字,文本词语的多音字组合中,通过任何一种,都可以视为录音。步骤S102,获取当前录音音频。本步骤中,根据所述设置语音任务的语音任务标识获取当前录音音频。用户从平台中认领步骤S101中的语音录音任务,按照语音录音任务的提示,对语音音频进行录制。可以将录音音频保存为多种格式后上传到平台上,同时,也可根据在平台上直接进行音频的录制。其录制音频本文档来自技高网...

【技术保护点】
1.一种音频数据的采集方法,所述方法包括:步骤S101,设置语音任务信息;所述语音任务信息中包括:语音任务标识及录音任务文本;步骤S102,根据所述设置语音任务的语音任务标识获取当前录音音频;步骤S103,对所述当前录音音频进行语音识别,获取当前录音文本;步骤S104,若所述当前录音文本与所述录音任务文本匹配,则对所述当前录音音频进行采集。

【技术特征摘要】
1.一种音频数据的采集方法,所述方法包括:步骤S101,设置语音任务信息;所述语音任务信息中包括:语音任务标识及录音任务文本;步骤S102,根据所述设置语音任务的语音任务标识获取当前录音音频;步骤S103,对所述当前录音音频进行语音识别,获取当前录音文本;步骤S104,若所述当前录音文本与所述录音任务文本匹配,则对所述当前录音音频进行采集。2.根据权利要求1所述的采集方法,所述语音任务信息中包括口音类型信息;所述口音类型信息包括:方言信息及普通话信息。3.根据权利要求2所述的采集方法,所述步骤S101中还包括:根据所述录音文本及方言类型获取所述录音文本对应的汉语拼音序列。4.根据权利要求3所述的采集方法,其中,所述步骤S103中还包括:对所述当前录音音频进行语音识别,获取当前录音汉语拼音序列。5.根据权利要求4所述的采集方法,其中,所述步骤S104中还包括:若当前录音汉语拼音序列与所述录音文本对应的汉语拼音序列匹配,则对所述当前录音音频进行采集。6.根据权利要求1所述的采集方法,所述步骤S104中还包括:生成用户记录信息,所述用户记录信息中包括,录音采集信息、客户奖励信息。7.根据权利要求1所述的采集方...

【专利技术属性】
技术研发人员:祝伊军赵恒艺
申请(专利权)人:苏州思必驰信息科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1