一种多设备录音的自动切分对齐方法技术

技术编号：17939787 阅读：40 留言：0更新日期：2018-05-15 20:10

本发明专利技术公开一种多设备录音的自动切分对齐方法，包括步骤：将不同形式的多个原始录音对应处理成同一格式的多个长时录音；将多个所述长时录音中所包含的相同长时录音进行关联；利用短时参考录音对相关联的长时录音分别进行对齐，然后切分成与所述短时参考录音对应的短时录音。本发明专利技术解决了录制多设备语音识别数据库的数据处理中复杂的问题。

An automatic segmentation and alignment method for multi device recording

The invention discloses an automatic segmentation and alignment method for multi device recording, which includes steps to process multiple original recordings in different forms into a plurality of long time recordings in the same format; relate the same long time recordings contained in a plurality of long time recordings, and use short time reference recordings for the related long time recordings. Do not alignment, and then cut into short time recording corresponding to the short reference recording. The invention solves complex problems in data processing of recording multi device speech recognition database.

全部详细技术资料下载

【技术实现步骤摘要】
一种多设备录音的自动切分对齐方法
本专利技术涉及语音识别数据库制作
，涉及一种多设备录音的自动切分对齐方法。
技术介绍
在语音识别数据库制作过程中，通过利用多设备同时采集录音，可大幅提高录音的效率和多样性。例如，通过在录音中同时采集头戴麦克风、手机和麦克风阵列的信号，可保证信道的多样性，进而提高识别数据库的实用性，使得数据库可在远场识别、唤醒、降噪等应用中使用。由于同时存在近讲、远讲的对应数据，可方便评估远场识别、唤醒、降噪算法的性能。然而在多设备录音采集的过程中，由于录音设备不同，各录音设备无法在时间上同时开始录音(即同时按下录音开关或发出录音命令)；部分录音设备的录音丢帧问题和录音过程中的操作失误，给语音识别数据的后期处理带来一定挑战。
技术实现思路
本专利技术的目的是针对现有技术中存在的技术缺陷，而提供一种用于语音识别数据库制作的多设备录音的自动切分对齐方法，通过以短时参考录音作为参考，实现自动分别地多个目标录音中的关联录音对齐，然后切分形成对应的短时录音存储在语音识别数据库中，从而实现将不同原始录音转化为语音识别系统可使用的短时录音。为实现本专利技术的目的所采用的技术方案是：一种多设备录音的自动切分对齐方法，包括步骤：将不同形式的多个原始录音对应处理成同一格式的多个长时录音；将多个所述长时录音中所包含的相同长时录音进行关联；利用短时参考录音对相关联的长时录音分别进行对齐，然后切分成与所述短时参考录音对应的短时录音。本专利技术中，所述长时录音是指不同录音设备自其录音开始时刻至结束时刻不间断采集的全部录音，包括有效录音与无效录音；所述短时录音指自所述...
一种多设备录音的自动切分对齐方法

【技术保护点】
一种多设备录音的自动切分对齐方法，其特征在于，包括步骤：将不同形式的多个原始录音对应处理成同一格式的多个长时录音；将多个所述长时录音中所包含的相同长时录音进行关联；利用短时参考录音对相关联的长时录音分别进行对齐，然后切分成与所述短时参考录音对应的短时录音。

【技术特征摘要】
1.一种多设备录音的自动切分对齐方法，其特征在于，包括步骤：将不同形式的多个原始录音对应处理成同一格式的多个长时录音；将多个所述长时录音中所包含的相同长时录音进行关联；利用短时参考录音对相关联的长时录音分别进行对齐，然后切分成与所述短时参考录音对应的短时录音。2.如权利要求1所述多设备录音的自动切分对齐方法，其特征在于，所述长时录音是指不同录音设备自其录音开始时刻至结束时刻不间断采集的全部录音，包括有效录音与无效录音；所述短时录音指自所述长时录音中切分出的有效录音。3.如权利要求1所述多设备录音的自动切分对齐方法，其特征在于，所述原始录音包括原始短时录音与原始长时录音，分别通过以下步骤形成所述长时录音；对原始长时录音，则在原始长时录音解压后进行统一格式转换，并按统一采样率对原始长时录音重新采样，从而形成所述长时录音；对原始短时录音，则在原始短时录音解压后进行统一格式转换，并按统一采样率对原始短时录音重新采样后，将原始短时录音根据时间戳拼接成所述长时录音。4.如权利要求1所述多设备录音的自动切分对齐方法，其特征在于，利用短时参考录音对多个相关联的长时录音分别进行对齐，是采用在多个所述相关联的长时录音中分别搜索短时参考录音来实现。5.如权利要求1所述多设备录音的自动切分...

【专利技术属性】
技术研发人员：吴妍，郑羲光，
申请(专利权)人：北京慧听科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人