The invention relates to the field of speech recognition technology, and discloses a multi-channel far-field and near-field corpus acquisition method and device. The method includes acquiring the name and number of external acquisition equipment, including near-field acquisition equipment and far-field acquisition equipment, setting recording thread parameters according to the number of external acquisition equipment, and multi-channel sound acquisition through all threads. Each thread shares a marker bit for identifying the state of sound picking; preserving multi-channel data; acquiring multi-channel near-field and far-field voice data simultaneously, and collecting data from each channel independently without interference. It realizes collecting multi-class corpus at one time and completing real-time automatic auditing and tagging, effectively reduces the labor and time costs, and improves the accuracy of corpus collection. Sex.
【技术实现步骤摘要】
一种多通道远近场语料采集方法及装置
本专利技术涉及语音识别
,尤其涉及一种多通道远近场语料采集方法及装置。
技术介绍
语音数据采集是语音识别中至关重要的阶段,语音数据的质量和数量直接影响到语音识别模型的性能。目前的语料采集装置和方法都是基于单通道采集,要么只采集近场语料,要么只采集远场语料,一般只采集近场语料,然后后期需要人工对语料进行审核标注。这种方法有三点弊端:第一,单通道的采集装置和方法采集效率低下,在大规模的语料采集任务中,这种方法使人力和时间成本急剧上升;第二,只采集近场或者只采集远场语料,使得用于语音识别训练的样本数量少、样本种类单一,这种数据训练出的语音识别模型鲁棒性和泛化能力比较差;第三,使用目前的采集装置和方法采集语料后,后期需要花费大量的人工和时间去对语料进行审核标注,而且审核标注工作容易使人疲劳,审核标注出错几率高,样本的标注错误又不容易被发现。
技术实现思路
本专利技术的主要目的在于提出一种多通道远近场语料采集方法及装置,能同时采集多通道近场和远场的语音数据,每个通道的数据同时且独立采集互不干扰,实现一次采集多类语料并完成实时自动审核标注,有效降低了人工和时间成本,提高了语料采集的准确性。为实现上述目的,本专利技术提供的一种多通道远近场语料采集方法,包括:获取外接采集设备的名称和编号,所述外接采集设备包括近场采集设备和远场采集设备;根据所述外接采集设备的数量设置录音线程参数;通过所有线程进行多通道采音,每个所述线程共享一个标志位,用于标识采音状态;保存多通道采音数据。可选地,所述获取外接采集设备的名称和编号之前还包括:加载预设的采 ...
【技术保护点】
1.一种多通道远近场语料采集方法,其特征在于,包括:获取外接采集设备的名称和编号,所述外接采集设备包括近场采集设备和远场采集设备;根据所述外接采集设备的数量设置录音线程参数;通过所有线程进行多通道采音,每个所述线程共享一个标志位,用于标识采音状态;保存多通道采音数据。
【技术特征摘要】
1.一种多通道远近场语料采集方法,其特征在于,包括:获取外接采集设备的名称和编号,所述外接采集设备包括近场采集设备和远场采集设备;根据所述外接采集设备的数量设置录音线程参数;通过所有线程进行多通道采音,每个所述线程共享一个标志位,用于标识采音状态;保存多通道采音数据。2.根据权利要求1所述的一种多通道远近场语料采集方法,其特征在于,所述获取外接采集设备的名称和编号之前还包括:加载预设的采集内容文件,调用第三方语音识别模型。3.根据权利要求2所述的一种多通道远近场语料采集方法,其特征在于,所述保存多通道采音数据之后还包括:通过所述第三方语音识别模型对所述多通道采音数据进行解码,通过所述预设的采集内容审核所述解码结果。4.根据权利要求1所述的一种多通道远近场语料采集方法,其特征在于,所述保存多通道采音数据之后还包括:对所述多通道采音数据进行声道分离。5.根据权利要求1所述的一种多通道远近场语料采集方法,其特征在于,所述获取外接采集设备的名称和编号之前还包括:获取被采集者的身份信息,并将所述身份信息保存至所述多通道采...
【专利技术属性】
技术研发人员:高亚龙,丁伟,
申请(专利权)人:深圳市伟文无线通讯技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。