快速自适应预测拟合语音方法、系统、终端及存储介质技术方案

技术编号：28457777 阅读：13 留言：0更新日期：2021-05-15 21:22

本发明专利技术涉及一种快速自适应预测拟合语音方法、系统、终端及存储介质，属于语音通信领域，应用于实时语音通信过程中由于通信链路异常导致的数据断流，其包括：步骤S1、获取断流前音频数据，当发生断流事件时，从数据缓冲区中读取断流前的音频数据；步骤S2、合成初始音频数据，分析断流之前的音频数据，并提取语音信号的峰值、断流时刻数据点值和主要频谱作为初始音频数据的特征值，基于所述特征值合成初始音频数据；步骤S3、调节断流后的音频音量以使初始音频数据播放时呈现音量渐弱的效果；步骤S4、获取断流恢复后的实际音频数据，并调节断流恢复后的实际音频数据的音量，以使实际音频数据播放时的音量逐渐恢复到断流前水平。本发明专利技术用于解决实时语音通信异常时播放端声音出现卡顿、爆响等异常响动使得用户体验糟糕的问题。题。题。

全部详细技术资料下载

【技术实现步骤摘要】
快速自适应预测拟合语音方法、系统、终端及存储介质

[0001]本专利技术涉及语音通信的
，尤其是涉及一种快速自适应预测拟合语音方法、系统、终端及存储介质。

技术介绍

[0002]随着21世纪移动通信技术的快速发展，通过移动终端进行实时语音通信的应用场景也越来越多，但是，在实时数字语音通信过程中，由于通信链路异常，如：数据拥塞、同频干扰、连接中断等，数据包会出现延时抵达、丢失等问题，从而导致数据断流。
[0003]在实时语音通信过程中，由于音频数据是实时播放，所以不可以大量缓存数据以及延时等待，而如果导致播放端声音出现卡顿、爆响等，用户体验就会十分糟糕。

技术实现思路

[0004]本专利技术目的一是提供一种快速自适应预测拟合语音方法，解决了实时语音通信异常时，播放端声音出现卡顿、爆响等使得用户体验糟糕的问题。
[0005]本专利技术的上述专利技术目的一是通过以下技术方案得以实现的：一种快速自适应预测拟合语音方法，其特征在于，包括以下步骤：步骤S1、获取断流前音频数据，当读取下一帧数据而不可得时，即判定断流事件发生，此时从音频数据缓冲区中获取断流前的音频数据作为分析样本；步骤S2、合成初始音频数据，从分析样本中获取峰值信息和断流时刻信息，基于预设的频率获取策略获取频率信息，进而根据峰值信息和频率信息合成初始音频数据，并基于断流时刻信息确定初始音频数据中的插入时间；步骤S3、调节初始音频数据的音量，使初始音频数据音量渐弱；步骤S4、获取恢复后音频数据，并调节恢复后音频数据的音量，当读取...

【技术保护点】

【技术特征摘要】
1.一种快速自适应预测拟合语音方法，其特征在于，包括以下步骤：步骤S1、获取断流前音频数据，当读取下一帧数据而不可得时，即判定断流事件发生，此时从音频数据缓冲区中获取断流前的音频数据作为分析样本；步骤S2、合成初始音频数据，从分析样本中获取峰值信息和断流时刻信息，基于预设的频率获取策略获取频率信息，进而根据峰值信息和频率信息合成初始音频数据，并基于断流时刻信息确定初始音频数据中的插入时间；步骤S3、调节初始音频数据的音量，使初始音频数据音量渐弱；步骤S4、获取恢复后音频数据，并调节恢复后音频数据的音量，当读取下一帧数据可得时，即判定恢复事件发生，使恢复后音频数据的音量逐渐恢复到断流前水平。2.根据权利要求1所述的快速自适应预测拟合语音方法，其特征在于，所述步骤S2、合成初始音频数据，具体包括以下步骤：步骤S201、获取初始音频数据的特征值，从所述分析样本中获取最大值、最小值和断流时刻的值，并基于预设的频率获取策略获取初始频率信息；步骤S202、初始化波形特征，根据所述初始音频数据的特征值建立一个合成声波表格，为使合成声波与断流前的声波接续，合成声波中第一个数值的相位和幅度与分析样本中最后一个数据的相位和幅度相同，基于所述断流时刻的值在所述合成声波表格中找到断流后初始音频数据的插入时间。3.根据权利要求2所述的快速自适应预测拟合语音方法，其特征在于，所述步骤S201中，预设的频率获取策略包括：采用离散傅里叶变换法对所述分析样本进行频谱分析，然后选取频谱分析结果中的主要频谱作为初始频率信息。4.根据权利要求2所述的快速自适应预测拟合语音方法，其特征在于，所述步骤S202中，预设的频率获取策略包括：对于人声仅需关注100
‑
1KHz频率范围，可选择100
‑
1KHz频率范围中任何一个固定频率...

【专利技术属性】
技术研发人员：李建飞，
申请(专利权)人：深圳飞思通科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人