用于tcp协议的基于能量阈值的语音缓冲丢包处理方法技术

技术编号：13283951 阅读：49 留言：0更新日期：2016-07-09 01:00

本发明专利技术公开了一种用于tcp协议的基于能量阈值的语音缓冲丢包处理方法。本发明专利技术通过主动丢掉不重要的音频数据包来自动降低延迟。本发明专利技术包含丢包判定模块、采集发送端、服务器转发端、接收播放端四部分，采集发送端、服务器转发端、接收播放端三部分使用相同的丢包判定算法，互相配合完成整个系统的基于tcp传输协议的语音缓冲丢包处理。本本发明专利技术从简单实用的角度出发，实际测试效果能够满足大多情况下的需求，在满足实用性的情况下尽量降低了算法的复杂程度。

全部详细技术资料下载

【技术实现步骤摘要】
用于tcp协议的基于能量阈值的语音缓冲丢包处理方法
本专利技术属于计算机数字语音处理通信领域，具体来说是一种用于tcp协议的基于能量阈值的语音缓冲丢包处理方法。
技术介绍
在计算机数字语音处理通信领域，比如在线教育系统、视频会议系统等，发送端从麦克风采集到的语音数据经过编码压缩后发送到服务器，服务器再将接收到的语音包转发给接收端，期间由于设备性能和网络情况不稳定造成的网络抖动现象会使得发送端、服务器端和接收端的语音处理复杂度大增，如果处理不好会出现接收端用户听到的发送端用户的语音卡顿、延迟大等现象，严重影响双方的交流，优秀的语音缓冲丢包处理可以有效缓解由于各种原因造成的语音卡顿和延迟问题，使交流双方能够顺畅的进行语音交流。在各种语音处理通信系统中，大部分系统都有语音缓冲丢包恢复功能模块。由于语音缓冲丢包处理主要是为了解决网络传输不稳定造成的语音延迟、卡顿等问题，所以语音缓冲丢包处理方法可以基于传输协议udp和tcp进行优化。由于udp协议传输时延迟比较小，为了降低语音延迟，当前大多语音交流系统使用的语音缓冲丢包处理方法都是基于udp传输协议进行优化的。udp协议是不可靠传输协议，除了有传输速度快的优点外，也有容易丢包、数据包乱序传输等缺点。由于udp的丢包是发生在网络传输层，所以应用本身不能进行控制。在遇到网络状况不好的情况下，通过udp协议传输的语音数据包就很容易会发生数据包丢失、传输乱序等现象，如果不对语音数据丢包和乱序进行处理，听到的声音就会出现卡顿断续、前后语音混乱等现象，为了解决这些问题，语音缓冲丢包恢复处理是必须的。语音缓冲丢包处理就是要对到来...

【技术保护点】
用于tcp协议的基于能量阈值的语音缓冲丢包处理方法，其特征在于包括如下步骤：步骤1、针对采集发送端，具体的：1‑1、从麦克风采集音频数据帧frame；1‑2、计算音频数据帧frame的能量值frame_energy：先用vad算法判断音频数据帧frame是否含有人的语音；如果不含语音，则认为是不重要的数据，将该frame的能量值frame_energy设置为0，如果含有语音则通过能量计算公式计算该frame能量值frame_energy；frame_energy＝|sample[0]|+…+|sample[count‑1]| 公式(1)其中，count是自然数，为步骤1‑1中所述的一帧中含有的采样点的个数，|sample[count‑1]|表示其中一个采样点的能量值；1‑3、直接获取当前发送队列中的语音缓冲长度buffer_ms1；1‑4、使用语音缓冲长度buffer_ms和能量值frame_energy，通过丢包判定模块判断该帧是否需要丢掉，如果不需要丢掉，则将该frame和frame_energy填加到发送队列，如果需要丢掉，则将该包丢掉；1‑5、发送线程每隔时间T定时检查发送队列...

【技术特征摘要】
1.用于tcp协议的基于能量阈值的语音缓冲丢包处理方法，其特征在于包括如下步骤：步骤1、针对采集发送端，具体的：1-1、从麦克风采集音频数据帧frame；1-2、计算音频数据帧frame的能量值frame_energy：先用vad算法判断音频数据帧frame是否含有人的语音；如果不含语音，则认为是不重要的数据，将该frame的能量值frame_energy设置为0，如果含有语音则通过能量计算公式计算该frame能量值frame_energy；frame_energy＝|sample[0]|+…+|sample[count-1]|公式(1)其中，count是自然数，为步骤1-1中所述音频数据帧frame一帧中含有的采样点的个数，|sample[count-1]|表示其中一个采样点的能量值；1-3、直接获取当前发送队列中的语音缓冲长度buffer_ms1；1-4、使用语音缓冲长度buffer_ms1和能量值frame_energy，通过丢包判定模块判断该帧是否需要丢掉，如果不需要丢掉，则将该frame和frame_energy填加到发送队列，如果需要丢掉，则将该帧丢掉；1-5、发送线程每隔时间T定时检查发送队列中是否有数据，如果有数据，则从发送队列取一帧frame数据出来，将frame编码压缩后和frame_energy一起打包成音频数据包，并发送到服务器转发端；所述的时间T是麦克风采集到的数据帧时长的一半；步骤2、针对服务器转发端，具体的：2-1、服务器转发端接收采集发送端发过来的音频数据包，2-2、从接收到的音频数据包中解析出该帧能量frame_energy2-3、取得当前转发队列中的语音缓冲长度buffer_ms22-4、使用buffer_ms2和frame_energy，通过丢包判定模块判断该音频数据包是否需要丢包，如果不需要丢包，则将该包填加到当前转发队列，如果需要丢包，则将该包丢掉；2-5、转发线程每隔时长T1定时检查转发队列中是否有数据，如果有数据，则从转发队列取出一个从发送端接收到的音频数据包转发给接收播放端；所述的时间T1与麦克风采集到的数据帧时长相等；步骤3、针对接收播放端，具体的：3-1、接收从服务器转发端转发过来的音频数据包3-2、从接收到的音频数据包中解析出该帧能量frame_energy3-3、取得当前播放队列中的语音缓冲长度buffer_ms33-4、使用buffer_ms3和frame_energy，通过丢包判定模块判断该音频数据包是否需要丢包，如果不需要丢包，则将该包填加到播放队列，如果需要丢包，则将该包丢掉；3-5、播放线程持续时长T3定时检测是否需要向播放设备中添加音频数据包，如果需要添加，则先判断播放队列的缓冲状态isBuffering：如果播放队列正在缓冲，即缓冲状态isBuffering＝＝true，则...

【专利技术属性】
技术研发人员：刘鹏，
申请(专利权)人：浙江万朋教育科技股份有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人