The invention discloses a real-time transcription method, device and computer equipment pole storage medium for court hearing voice. The method includes collecting original voice data through microphone array, preprocessing original voice data to obtain target voice data, extracting voice print features from target voice data by MFCC algorithm, and obtaining target voice print features based on microphone array identification. Query the database to obtain at least one identity data corresponding to the location of the microphone array identification and standard voiceprint features corresponding to each acquired identity data; match each standard voiceprint feature based on the target voiceprint features to obtain the target identity data corresponding to the matched standard voiceprint features; adopt the pre-trained speech recognition model to identify the target voiceprint. Feature recognition, acquisition of target text data corresponding to target voiceprint features; real-time display of target text data and target identity data in display equipment, to solve the problem of inefficiency in the process of manual transcription.
【技术实现步骤摘要】
庭审语音实时转写方法、装置、计算机设备及存储介质
本专利技术涉及数据处理领域,尤其涉及一种庭审语音实时转写方法、装置、计算机设备及存储介质。
技术介绍
目前法庭庭审中,通常由书记员事先确认每一当事人的身份信息之后,再对每一当事人陈述的意见或内容进行记录。这种由书记员人工对法庭庭审内容进行整理和记录的方式,可能对当事人陈述的意见或内容造成一定的误差,且通过人工记录速度较慢,影响庭审进程,导致实时转写效率低下。
技术实现思路
本专利技术实施例提供一种庭审语音实时转写方法、装置、计算机设备及存储介质,以解决人工转写庭审记录过程中效率低下的问题。一种庭审语音实时转写方法,包括:通过麦克风阵列采集原始语音数据,每一所述原始语音数据对应一麦克风阵列标识;对所述原始语音数据进行数据预处理,获取目标语音数据;采用MFCC算法对所述目标语音数据进行声纹特征提取,获取目标声纹特征;基于所述麦克风阵列标识查询数据库,获取与所述麦克风阵列标识所在位置对应的至少一个身份数据和与每一获取的身份数据相对应的标准声纹特征;基于所述目标声纹特征与每一所述标准声纹特征进行匹配处理,获取匹配的标准声纹特征对应的目标身份数据;采用预先训练的语音识别模型对所述目标声纹特征进行识别,获取与所述目标声纹特征对应的目标文字数据;在显示设备上实时显示所述目标文字数据和对应的所述目标身份数据。一种庭审语音实时转写装置,包括:采集模块,用于通过麦克风阵列采集原始语音数据,每一所述原始语音数据对应一麦克风阵列标识;预处理模块,用于对所述原始语音数据进行数据预处理,获取目标语音数据;声纹特征提取模块,用于采用MFCC ...
【技术保护点】
1.一种庭审语音实时转写方法,其特征在于,包括:通过麦克风阵列采集原始语音数据,每一所述原始语音数据对应一麦克风阵列标识;对所述原始语音数据进行数据预处理,获取目标语音数据;采用MFCC算法对所述目标语音数据进行声纹特征提取,获取目标声纹特征;基于所述麦克风阵列标识查询数据库,获取与所述麦克风阵列标识所在位置对应的至少一个身份数据和与每一获取的身份数据相对应的标准声纹特征;基于所述目标声纹特征与每一所述标准声纹特征进行匹配处理,获取匹配的标准声纹特征对应的目标身份数据;采用预先训练的语音识别模型对所述目标声纹特征进行识别,获取与所述目标声纹特征对应的目标文字数据;在显示设备上实时显示所述目标文字数据和对应的所述目标身份数据。
【技术特征摘要】
1.一种庭审语音实时转写方法,其特征在于,包括:通过麦克风阵列采集原始语音数据,每一所述原始语音数据对应一麦克风阵列标识;对所述原始语音数据进行数据预处理,获取目标语音数据;采用MFCC算法对所述目标语音数据进行声纹特征提取,获取目标声纹特征;基于所述麦克风阵列标识查询数据库,获取与所述麦克风阵列标识所在位置对应的至少一个身份数据和与每一获取的身份数据相对应的标准声纹特征;基于所述目标声纹特征与每一所述标准声纹特征进行匹配处理,获取匹配的标准声纹特征对应的目标身份数据;采用预先训练的语音识别模型对所述目标声纹特征进行识别,获取与所述目标声纹特征对应的目标文字数据;在显示设备上实时显示所述目标文字数据和对应的所述目标身份数据。2.如权利要求1所述的庭审语音实时转写方法,其特征在于,所述麦克风阵列包括至少三个麦克风;所述对所述原始语音数据进行数据预处理,获取目标语音数据,包括:采用GCC估计算法估算所述原始语音数据到达第一麦克风和第二麦克风的时延差;基于所述原始语音数据到达所述第一麦克风和所述第二麦克风的时延差,采用几何定位法获取所述原始语音数据的空间坐标;基于所述原始语音数据的空间坐标,确定所述麦克风阵列中每一麦克风对应的权重,采用加权公式对所述原始语音数据进行加权处理,获取待滤波语音数据;其中,所述加权公式为y(t)为待滤波语音数据,n为麦克风数量,i为第i个麦克风的标识,wi为第i个麦克风对应的权重,xi(t)为第i个麦克风接收到的原始语音数据;采用维纳滤波算法对所述待滤波语音数据进行滤波处理,获取目标语音数据。3.如权利要求2所述的庭审语音实时转写方法,其特征在于,采用GCC估计算法估算所述原始语音数据到达第一麦克风和第二麦克风的时延差,包括:基于所述第一麦克风和所述第二麦克风,获取所述第一麦克风和所述第二麦克风的原始互相关函数;对所述原始互相关函数做傅里叶变换,获取互功率谱;对所述互功率谱进行加权处理,获取加权互功率谱,并对所述加权互功率谱做反傅里叶变换,获取目标互相关函数;基于所述目标互相关函数,获取所述目标互相关函数的极大值,将所述极大值作为所述原始语音数据到达所述第一麦克风和所述第二麦克风的时延差。4.如权利要求2所述的庭审语音实时转写方法,其特征在于,所述基于所述原始语音数据到达所述第一麦克风和所述第二麦克风的时延差,采用几何定位法获取所述原始语音数据的空间坐标,包括:基于所述原始语音数据到达所述第一麦克风和所述第二麦克风的时延差和每一所述麦克风的空间坐标,采用定位公式获取所述原始语音数据的空间坐标;其中,所述定位公式为||s-mi||-||s-mj||=τij*v,(i=1,...,n)(j=1,...,n),s为原始语音数据的空间坐标,i和j为麦克风标识,mi为第i个麦克风的空间坐标,mj为第j个麦克风的空间坐标,τij为原始语音数据到达麦克风i和麦克风j的时延差,v为声速。5.如权利要求1所述的庭审语音实时转写方法,其特征在于,所述基于所述目标声纹特征与所述标准声纹特征进行匹配处理,获取匹配的标准声纹特征对应的目标身份数据,包括:将...
【专利技术属性】
技术研发人员:黄锦伦,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。