音频处理方法及装置制造方法及图纸

技术编号：21552175 阅读：43 留言：0更新日期：2019-07-07 00:13

本发明专利技术提供一种音频处理方法及装置，涉及音频处理技术领域，该方法包括：获取缓冲区初始音频数据中M次存取交替的音频数据，和缓冲区实时音频数据中N次存取交替的音频数据，可以得到M个第一网络抖动估算值和N个第二网络抖动估算值，在M个第一网络抖动估算值和N个第二网络抖动估算值中分别确定最大第一网络抖动估算值和最大第二网络抖动估算值，根据最大的第一网络抖动估算值和最大的第二网络抖动估算值可以确定网络状态，根据网络状态对缓冲区的音频数据进行处理，从而降低终端接收音频数据的延迟。

Audio Processing Method and Device

全部详细技术资料下载

【技术实现步骤摘要】
音频处理方法及装置
本专利技术涉及音频处理
，具体而言，涉及一种音频处理方法及装置。
技术介绍
随着科技的快速发展，音频播放的应用与技术愈加广泛，用户在终端上安装播放器后，就可以实现在线听取音频，终端在接收音频数据时，音频数据的语义完整是十分重要的。相关技术中，音频数据在传输中通常会由于网络抖动因素，使得音频数据的传输受到影响，为了降低音频传输中网络抖动造成的影响，通常会引入buf(buffer,缓冲区)，在服务器中的缓冲区对音频数据进行存储，服务器的缓冲区将音频数据发送至终端，终端可以进行接收音频数据。但是，当缓冲区的音频数据存储的比较多时，会导致音频数据的传输时间变长，使得终端接收音频数据出现延迟。
技术实现思路
本专利技术的目的在于，针对上述现有技术中的不足，提供一种音频处理方法及装置，以解决终端接收音频数据出现延迟的问题。为实现上述目的，本专利技术实施例采用的技术方案如下：第一方面，本专利技术实施例提供了一种音频处理方法，所述方法包括：获取缓冲区初始音频数据中M次存取交替的音频数据，和所述缓冲区实时音频数据中N次存取交替的音频数据，其中，M大于等于1，N...

【技术保护点】
1.一种音频处理方法，其特征在于，所述方法包括：获取缓冲区初始音频数据中M次存取交替的音频数据，和所述缓冲区实时音频数据中N次存取交替的音频数据，其中，M大于等于1，N大于等于1，M和N为正整数；根据所述M次存取交替的音频数据和所述N次存取交替的音频数据，分别得到M个第一网络抖动估算值和N个第二网络抖动估算值；从M个所述第一网络抖动估算值中确定最大的第一网络抖动估算值得到所述初始音频数据的网络抖动估算值，从N个所述第二网络抖动估算值中确定最大的第二网络抖动估算值得到实时音频数据的网络抖动估算值；根据所述初始音频数据的网络抖动估算值和所述实时音频数据的网络抖动估算值确定所述缓冲区的网络状态；根据...

【技术特征摘要】
1.一种音频处理方法，其特征在于，所述方法包括：获取缓冲区初始音频数据中M次存取交替的音频数据，和所述缓冲区实时音频数据中N次存取交替的音频数据，其中，M大于等于1，N大于等于1，M和N为正整数；根据所述M次存取交替的音频数据和所述N次存取交替的音频数据，分别得到M个第一网络抖动估算值和N个第二网络抖动估算值；从M个所述第一网络抖动估算值中确定最大的第一网络抖动估算值得到所述初始音频数据的网络抖动估算值，从N个所述第二网络抖动估算值中确定最大的第二网络抖动估算值得到实时音频数据的网络抖动估算值；根据所述初始音频数据的网络抖动估算值和所述实时音频数据的网络抖动估算值确定所述缓冲区的网络状态；根据所述网络状态处理所述缓冲区的音频数据。2.根据权利要求1所述的方法，其特征在于，根据所述M次存取交替的音频数据和所述N次存取交替的音频数据，分别得到M个第一网络抖动估算值和N个第二网络抖动估算值，包括：获取初始音频数据M次存入音频数据和M次取出音频数据，得到M个所述第一网络抖动估算值，其中，获取一次存入音频数据和一次取出音频数据，得到所述第一网络抖动估算值，包括：获取所述缓冲区初始音频数据存入时的最大序列号音频数据和初始音频数据取出时的最大序列号音频数据；根据初始音频数据存入时的最大序列号音频数据和初始音频数据取出时的最大序列号音频数据的差值，得到初始音频数据一次存取交替的所述第一网络抖动估算值；获取实时音频数据N次存入音频数据和N次取出音频数据，得到N个所述第二网络抖动估算值，其中，获取一次存入音频数据和一次取出音频数据，得到所述第二网络抖动估算值，包括：获取所述缓冲区实时音频数据存入时的最大序列号音频数据和实时音频数据取出时的最大序列号音频数据；根据实时音频数据存入时的最大序列号音频数据和实时音频数据取出时的最大序列号音频数据的差值，得到实时音频数据一次存取交替的第二网络抖动估算值。3.根据权利要求1所述的方法，其特征在于，根据所述初始音频数据的网络抖动估算值和所述实时音频数据的网络抖动估算值确定所述缓冲区的网络状态，包括：比较所述初始音频数据的网络抖动估算值和所述实时音频数据的网络抖动估算值；若所述实时音频数据的网络抖动估算值大于等于所述初始音频数据的网络抖动估算值，确定所述缓冲区的网络状态变坏；若所述实时音频数据的网络抖动估算值小于所述初始音频数据的网络抖动估算值，确定所述缓冲区的网络状态变好。4.根据权利要求3所述的方法，其特征在于，根据所述网络状态处理所述缓冲区的音频数据，包括：当所述缓冲区的网络状态变好时，根据所述初始音频数据的网络抖动估算值和所述实时音频数据的网络抖动估算值，确定待丢弃音频数据的量；根据所述待丢弃音频数据的量，将待丢弃的音频数据在预设时间内进行丢弃；当所述缓冲区的网络状态变坏时，增大所述缓冲区的容量值。5.根据权利要求3所述的方法，其特征在于，根据所述网络状态处理所述缓冲区的音频数据，包括：当所述缓冲区的网络状态变好时，对所述缓冲区的音频数据进行语音活动检测VAD得到静音数据，将所述静音数据进行丢弃；当所述缓冲区的网络状态变坏时，增大所述缓...

【专利技术属性】
技术研发人员：郭志鸣，梁学群，张建红，
申请(专利权)人：北京三体云联科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人