The present invention discloses an audio data acquisition method and system, which includes: 1) setting up voice task information, and the voice task information includes: voice task identification and recording task text. According to the voice task identification of the set voice task, the current recorded audio is acquired in Fig. 102. The current recorded audio is recognized by speech recognition to obtain the current recorded text. If the current recording text matches the recording task text, the current recording audio is collected. In this application, audio recordings are audited automatically by identifying the contents of the recordings. Considering the factors that can not be audited due to language deviation such as dialect, the method of auxiliary recognition of Chinese phonetic alphabet is also adopted in the present invention to audit the audio recordings, which not only improves the accuracy of audio recordings collection, but also improves the audio recordings collection. Efficiency.
【技术实现步骤摘要】
音频数据的采集方法及系统
本专利技术属于音频信息的处理及应用的
,尤其涉及音频数据的采集方法及系统。
技术介绍
采集音频数据的产品有各类付费录音采集app的录音技术及天猫精灵等智能语音产品的语音识别技术。音频数据是语音技术研究的重要生产资料。合法采集录音数据,通常的做法有两个,一个通过寻找固定群体,提供录音app和相应的文本,用户按照要求录音完成并人工审核通过后获取一定的酬劳。另一种类似于天猫精灵,通过语音识别与用户交互,并采集分析用户音频数据。付费录音采集app,需要人工审核录音,数据采集样本少,周期长。智能语音产品的语音识别,采用通用语音识别技术,且样本随机性高,无法按要求采集精准音频数据(如采集语音:你好小驰,需要快速和慢速各十遍)。付费录音app,只有录音技术,没有语音识别自动审核当前录音的准确度。智能语音产品的语音识别,是通用的语音识别技术,无法针对特定关键字的语音识别结果,进行审核,并实时调整通过率。本行业从业人员为解决这些缺陷,采取的是结合录音app和语音交互产品的特点,通过语音技能或者游戏的方式,引导用户说出想要的关键字,但是如果一旦用户故意说错或者环境嘈杂,即使音频质量不合格,也无法纠错,让用户重新录音,否则容易使用户失去兴趣。这种方式虽然在录音效率和录音质量上有所平衡,但音频质量仍然不能很好的达到训练所需标准。我们根据过去的经验,放弃利用语音交互产品大规模采集音频的方法,用新的角度,结合录音app录音精准的优点,改进了人工审核效率低的问题。
技术实现思路
本专利技术实施例提供一种音频数据的采集方法及系统,用于至少解决上述技术问题之一。 ...
【技术保护点】
1.一种音频数据的采集方法,所述方法包括:步骤S101,设置语音任务信息;所述语音任务信息中包括:语音任务标识及录音任务文本;步骤S102,根据所述设置语音任务的语音任务标识获取当前录音音频;步骤S103,对所述当前录音音频进行语音识别,获取当前录音文本;步骤S104,若所述当前录音文本与所述录音任务文本匹配,则对所述当前录音音频进行采集。
【技术特征摘要】
1.一种音频数据的采集方法,所述方法包括:步骤S101,设置语音任务信息;所述语音任务信息中包括:语音任务标识及录音任务文本;步骤S102,根据所述设置语音任务的语音任务标识获取当前录音音频;步骤S103,对所述当前录音音频进行语音识别,获取当前录音文本;步骤S104,若所述当前录音文本与所述录音任务文本匹配,则对所述当前录音音频进行采集。2.根据权利要求1所述的采集方法,所述语音任务信息中包括口音类型信息;所述口音类型信息包括:方言信息及普通话信息。3.根据权利要求2所述的采集方法,所述步骤S101中还包括:根据所述录音文本及方言类型获取所述录音文本对应的汉语拼音序列。4.根据权利要求3所述的采集方法,其中,所述步骤S103中还包括:对所述当前录音音频进行语音识别,获取当前录音汉语拼音序列。5.根据权利要求4所述的采集方法,其中,所述步骤S104中还包括:若当前录音汉语拼音序列与所述录音文本对应的汉语拼音序列匹配,则对所述当前录音音频进行采集。6.根据权利要求1所述的采集方法,所述步骤S104中还包括:生成用户记录信息,所述用户记录信息中包括,录音采集信息、客户奖励信息。7.根据权利要求1所述的采集方...
【专利技术属性】
技术研发人员:祝伊军,赵恒艺,
申请(专利权)人:苏州思必驰信息科技有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。