快速自适应预测拟合语音方法、系统、终端及存储介质技术方案

技术编号:28457777 阅读:13 留言:0更新日期:2021-05-15 21:22
本发明专利技术涉及一种快速自适应预测拟合语音方法、系统、终端及存储介质,属于语音通信领域,应用于实时语音通信过程中由于通信链路异常导致的数据断流,其包括:步骤S1、获取断流前音频数据,当发生断流事件时,从数据缓冲区中读取断流前的音频数据;步骤S2、合成初始音频数据,分析断流之前的音频数据,并提取语音信号的峰值、断流时刻数据点值和主要频谱作为初始音频数据的特征值,基于所述特征值合成初始音频数据;步骤S3、调节断流后的音频音量以使初始音频数据播放时呈现音量渐弱的效果;步骤S4、获取断流恢复后的实际音频数据,并调节断流恢复后的实际音频数据的音量,以使实际音频数据播放时的音量逐渐恢复到断流前水平。本发明专利技术用于解决实时语音通信异常时播放端声音出现卡顿、爆响等异常响动使得用户体验糟糕的问题。题。题。

【技术实现步骤摘要】
快速自适应预测拟合语音方法、系统、终端及存储介质


[0001]本专利技术涉及语音通信的
,尤其是涉及一种快速自适应预测拟合语音方法、系统、终端及存储介质。

技术介绍

[0002]随着21世纪移动通信技术的快速发展,通过移动终端进行实时语音通信的应用场景也越来越多,但是,在实时数字语音通信过程中,由于通信链路异常,如:数据拥塞、同频干扰、连接中断等,数据包会出现延时抵达、丢失等问题,从而导致数据断流。
[0003]在实时语音通信过程中,由于音频数据是实时播放,所以不可以大量缓存数据以及延时等待,而如果导致播放端声音出现卡顿、爆响等,用户体验就会十分糟糕。

技术实现思路

[0004]本专利技术目的一是提供一种快速自适应预测拟合语音方法,解决了实时语音通信异常时,播放端声音出现卡顿、爆响等使得用户体验糟糕的问题。
[0005]本专利技术的上述专利技术目的一是通过以下技术方案得以实现的:一种快速自适应预测拟合语音方法,其特征在于,包括以下步骤:步骤S1、获取断流前音频数据,当读取下一帧数据而不可得时,即判定断流事件发生,此时从音频数据缓冲区中获取断流前的音频数据作为分析样本;步骤S2、合成初始音频数据,从分析样本中获取峰值信息和断流时刻信息,基于预设的频率获取策略获取频率信息,进而根据峰值信息和频率信息合成初始音频数据,并基于断流时刻信息确定初始音频数据中的插入时间;步骤S3、调节初始音频数据的音量,使初始音频数据音量渐弱;步骤S4、获取恢复后音频数据,并调节恢复后音频数据的音量,当读取下一帧数据可得时,即判定恢复事件发生,使恢复后音频数据的音量逐渐恢复到断流前水平。
[0006]通过采用上述技术方案,基于特征值合成的初始音频数据与断流前的音频数据存在相同特征,从而使断流事件的发生不会导致音频播放的卡顿和爆响等问题,而通过控制断流后的音频音量,使得断流事件发生后音频音量呈现逐渐渐弱的效果,而在断流恢复后通过控制正常音频的音量,使得音频音量逐渐恢复至断流前水平,从而使用户拥有好的体验。
[0007]本专利技术进一步设置为:所述步骤S2、合成初始音频数据,具体包括以下步骤:步骤S201、获取初始音频数据的特征值,从所述分析样本中获取最大值、最小值和断流时刻的值,并基于预设的频率获取策略获取初始频率信息;步骤S202、初始化波形特征,根据所述初始音频数据的特征值建立一个合成声波表格,为使合成声波与断流前的声波接续,合成声波中第一个数值的相位和幅度需要与分析样本中最后一个数据的相位和幅度相同,基于所述断流时刻的值即可在所述合成声波表格中找到断流后初始音频数据的插入时间。
[0008]通过采用上述技术方案,从分析样本中提取特征值,最终根据特征值建立合成声波表格,且找到合成声波表格中的断流后初始音频数据的插入时间,这样能够确保合成的音频信号能够贴近断流前的音频数据,使得断流事件的发生不会导致音频爆音问题。
[0009]本专利技术进一步设置为:所述步骤S201中,预设的频率获取策略包括:采用离散傅里叶变换法对所述分析样本进行频谱分析,然后选取频谱分析结果中的主要频谱作为初始音频数据的基准频率。
[0010]通过采用上述技术方案,通过对断流前的分析样本进行离散傅里叶变换以作频谱分析,从而获得断流前音频数据的主要频谱,将该主频谱作为后续初始音频数据的主频谱可以使初始音频数据在音调上更接近于断流前音频的音调。
[0011]本专利技术进一步设置为:所述步骤S102中,预设的频率获取策略包括:对于人声仅需关注100

1KHz频率范围,可选择100

1KHz频率范围中任何一个固定频率作为初始音频数据的基准频率。
[0012]通过采用上述技术方案,通过在人类听觉允许的频率范围内选取一个固定频率作为合成声波信号的基准频率,使得算法简单快速,并可降低对处理器性能的要求。
[0013]本专利技术进一步设置为:所述步骤S3中,在断流事件发生时,首先记录下音频播放器的当前音量,在当前音量为静音状态时,则不需要启动音量减小过程;在当前音量为非静音状态时,则启动音量减小过程。
[0014]通过采用上述技术方案,当音频信号发生断流事件时,音频播放端不会出现卡顿、爆响等问题。
[0015]本专利技术进一步设置为:所述步骤S4中,在数据断流事件发生后通信又恢复正常时,首先判断此时距断流事件发生时的间隔时长是否大于设定值,当间隔时长小于设定值时,则继续等待直至间隔时长大于设定值;当所述间隔时长大于设定值时,再判断当前音量是否为断流前水平,在当前音量为断流前水平,则无需启动音量增加过程,而在当前音量不是断流前水平时,则启动音量增加过程。
[0016]通过采用上述技术方案,当断流恢复且当前音量不是断流前水平,使得音频播放端呈现音量渐强的效果,增加用户舒适感。
[0017]本专利技术进一步设置为:所述音量减小过程与所述音量增加过程中调节音量的速度有三种方式:线性、指数和对数。
[0018]通过采用上述技术方案,使用线性方式调节音频音量的数据运算量最小,在系统的数据运算能力受限的情况下可使用线性方式以节约系统运算资源;而使用指数和对数的方式调节音频音量的数据运算量相对较大,在系统的数据运算能力允许的情况下,音量减小过程使用指数方式,而音量增加过程使用对数方式,这样可使得用户体验感最好;可根据使用场景具体选择线性、指数或对数的方式调节音频音量。
[0019]本专利技术目的二是提供一种快速自适应预测拟合语音系统,具有在实时语音通信出现数据断流时避免语音播放出现卡顿和爆响等问题的特点。
[0020]本专利技术的上述专利技术目的二是通过以下技术方案得以实现的:一种快速自适应预测拟合语音系统,包括:断流前数据获取模块1,当发生断流事件时,从数据缓冲区中读取断流前的音频数据;
初始音频数据合成模块2,从断流前音频数据中获取峰值和断流时刻数据作为初始音频数据的特征值,并基于预设的频率获取策略获取初始频率信息;断流后音量调节模块3,调整断流后的音频音量以使初始音频数据播放时呈现音量渐弱的效果;断流恢复后音量调节模块4,获取断流恢复后音频数据,并调整断流恢复后的音频音量以使实际音频数据播放时逐渐恢复到断流前水平。
[0021]本专利技术目的三是提供一种智能终端,具有断流事件可被快速检测到且基于断流前音频数据快速合成初始音频数据,并在嵌入式的CPC上运行的特点。
[0022]本专利技术的上述专利技术目的三是通过以下技术方案得以实现的:一种智能终端,包括存储器和处理器,所属存储器上存储有能够被处理器加载并执行如权利要求1至7中任一种方法的计算机程序。
[0023]本专利技术目的四是提供一种计算机可读存储介质,能够存储相应的程序,具有快速稳定拟合语音的特点。
[0024]本专利技术的上述专利技术目的四是通过以下技术方案得以实现的:一种计算机可读存储介质,存储有能够被处理器加载并执行如权利要求1至7中任一种方法的计算机程序。
[0025]综上所述,本专利技术的有益技术效果为:本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种快速自适应预测拟合语音方法,其特征在于,包括以下步骤:步骤S1、获取断流前音频数据,当读取下一帧数据而不可得时,即判定断流事件发生,此时从音频数据缓冲区中获取断流前的音频数据作为分析样本;步骤S2、合成初始音频数据,从分析样本中获取峰值信息和断流时刻信息,基于预设的频率获取策略获取频率信息,进而根据峰值信息和频率信息合成初始音频数据,并基于断流时刻信息确定初始音频数据中的插入时间;步骤S3、调节初始音频数据的音量,使初始音频数据音量渐弱;步骤S4、获取恢复后音频数据,并调节恢复后音频数据的音量,当读取下一帧数据可得时,即判定恢复事件发生,使恢复后音频数据的音量逐渐恢复到断流前水平。2.根据权利要求1所述的快速自适应预测拟合语音方法,其特征在于,所述步骤S2、合成初始音频数据,具体包括以下步骤:步骤S201、获取初始音频数据的特征值,从所述分析样本中获取最大值、最小值和断流时刻的值,并基于预设的频率获取策略获取初始频率信息;步骤S202、初始化波形特征,根据所述初始音频数据的特征值建立一个合成声波表格,为使合成声波与断流前的声波接续,合成声波中第一个数值的相位和幅度与分析样本中最后一个数据的相位和幅度相同,基于所述断流时刻的值在所述合成声波表格中找到断流后初始音频数据的插入时间。3.根据权利要求2所述的快速自适应预测拟合语音方法,其特征在于,所述步骤S201中,预设的频率获取策略包括:采用离散傅里叶变换法对所述分析样本进行频谱分析,然后选取频谱分析结果中的主要频谱作为初始频率信息。4.根据权利要求2所述的快速自适应预测拟合语音方法,其特征在于,所述步骤S202中,预设的频率获取策略包括:对于人声仅需关注100

1KHz频率范围,可选择100

1KHz频率范围中任何一个固定频率...

【专利技术属性】
技术研发人员:李建飞
申请(专利权)人:深圳飞思通科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1