The invention discloses a speech processing method. The method includes: acquiring the first audio information before the abnormal time and the second audio information after the abnormal time; calculating the time of the second audio information according to the first audio information and the second audio information to determine the correct time stamp of the second audio information; correcting the second audio information according to the time stamp to obtain the second audio information including the continuous time stamp Third audio information. The invention also discloses a speech processing device and a computer readable storage medium. The invention can guarantee the continuity of the whole voice data timestamp.
【技术实现步骤摘要】
语音的处理方法、装置和计算机可读存储介质
本专利技术涉及录音转写领域,尤其涉及一种语音的处理方法、装置和计算机可读存储介质。
技术介绍
随着社会的发展,人们的生活越来越高效化,尤其在现代会议过程或采访过程中,经常需要用到录音转写设备将语音转换为文字进行记录,提高工作效率。因此,录音转写设备就为文字工作者提供了便捷高效的语音转文字服务。但是,目前市面上的录音设备时间缺乏连续性,一般App或录音设备,由于断网需要重新连接,每次重新连接提交的数据,产生的时间戳都是相对于当前重新连接时间的,与断网前的录音的时间没有联系,断网后相当于开始一段新的录音,而实际过程中,用户在断网前后的录音是连续的,并没有产生中断,这样就会导致整个过程的时间戳不连续。
技术实现思路
本专利技术的主要目的在于提供一种语音的处理方法、装置和计算机可读存储介质,旨在保证整个语音数据时间戳的连续性。为实现上述目的,本专利技术提供一种语音的处理方法,所述语音的处理方法包括以下步骤:获取异常时刻前的第一音频信息和异常时刻后的第二音频信息;根据所述第一音频信息和第二音频信息对所述第二音频信息的时间进行计算,确定所述第二音频信息正确的时间戳;根据所述时间戳对所述第二音频信息进行校正,获得包括连续时间戳的第三音频信息。可选地,所述根据所述第一音频信息和第二音频信息对所述第二音频信息的时间进行计算,确定所述第二音频信息正确的时间戳的步骤包括:确定所述第一音频信息的起始时间信息和音频数据大小;< ...
【技术保护点】
1.一种语音的处理方法,其特征在于,所述语音的处理方法包括以下步骤:/n获取异常时刻前的第一音频信息和异常时刻后的第二音频信息;/n根据所述第一音频信息和第二音频信息对所述第二音频信息的时间进行计算,确定所述第二音频信息正确的时间戳;/n根据所述时间戳对所述第二音频信息进行校正,获得包括连续时间戳的第三音频信息。/n
【技术特征摘要】
1.一种语音的处理方法,其特征在于,所述语音的处理方法包括以下步骤:
获取异常时刻前的第一音频信息和异常时刻后的第二音频信息;
根据所述第一音频信息和第二音频信息对所述第二音频信息的时间进行计算,确定所述第二音频信息正确的时间戳;
根据所述时间戳对所述第二音频信息进行校正,获得包括连续时间戳的第三音频信息。
2.如权利要求1所述的语音的处理方法,其特征在于,所述根据所述第一音频信息和第二音频信息对所述第二音频信息的时间进行计算,确定所述第二音频信息正确的时间戳的步骤包括:
确定所述第一音频信息的起始时间信息和音频数据大小;
根据所述音频数据大小利用第一公式计算出所述第二音频信息的偏移时间;
根据所述偏移时间和所述起始时间信息利用第二公式进行计算,得到所述第二音频信息正确的时间戳。
3.如权利要求2所述的语音的处理方法,其特征在于,所述第一公式为:
T1=(Q*8.0)/(S*M*N)*1000,
其中T1为偏移时间,Q为第一音频信息的音频数据大小,S为采样率,M为每次采样位数,N为通道数。
4.如权利要求2所述的语音的处理方法,其特征在于,所述第二公式为:
T=T2+T1,
其中,T1为第二音频信息的偏移时间,T2为第一音频信息的起始时间信息,T为第二音频信息正确的时间戳。
5.如权利要求1所述的语音的处理方法,其特征在于...
【专利技术属性】
技术研发人员:朱浩华,邓高锋,陈永金,
申请(专利权)人:深圳壹秘科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。