【技术实现步骤摘要】
一种移动终端及其处理语音通信的方法
本申请涉及一种移动终端对语音通信的处理方法。
技术介绍
以手机为代表的移动终端(UE,UserEquipment,用户设备)已成为人们生活中不可或缺的一部分,时延(delay)是移动终端进行语音通信的一个重要指标。当端到端的时延(end-to-enddelay)低于150ms时,人感觉不到。当端到端的时延超过150ms且小于450ms时,人能感受到但能忍受,不影响通话交流。当端到端的时延大于1s时,就会严重影响通话交流,用户体验会比较差。中国移动通信集团有限公司的音频测试规范中,要求手机在发送和接收方向的端到端时延不能超过220ms,建议在185ms以内,否则无法通过其认证。请参阅图1,这是语音从采集到播放的传输过程。两台移动终端之间进行语音通信时,语音的传输过程包括三部分:一是从发送端采集到语音数据并处理后发送到网络设备,二是网络设备之间传送,三是从网络设备发送给接收端并播放出来。前述每一部分都会产生时延,本申请仅讨论移动终端上引入的时延。移动终端和网络设备之间的时延、网络设备和 ...
【技术保护点】
1.一种移动终端处理语音通信的方法,其特征是,包括如下步骤:/n步骤S10:语音通信开始时,预置接收端的播放缓存区中的读指针和写指针位置,设置参考值和阈值;将读指针预置在写指针之前;所述阈值小于所述参考值;/n步骤S20:每隔第一时间检测一次播放缓存区中的读指针和写指针的距离称为检测距离;/n步骤S30:用偏移状态表示播放缓存区的历史状态,将偏移状态左移两位,根据检测距离与参考值和阈值之和或之差的比较结果,确定偏移状态的新取值;/n步骤S40:根据VAD从语音PCM数据流中的检测情况,联合偏移状态决定进行样本数插值还是抽取。/n
【技术特征摘要】
1.一种移动终端处理语音通信的方法,其特征是,包括如下步骤:
步骤S10:语音通信开始时,预置接收端的播放缓存区中的读指针和写指针位置,设置参考值和阈值;将读指针预置在写指针之前;所述阈值小于所述参考值;
步骤S20:每隔第一时间检测一次播放缓存区中的读指针和写指针的距离称为检测距离;
步骤S30:用偏移状态表示播放缓存区的历史状态,将偏移状态左移两位,根据检测距离与参考值和阈值之和或之差的比较结果,确定偏移状态的新取值;
步骤S40:根据VAD从语音PCM数据流中的检测情况,联合偏移状态决定进行样本数插值还是抽取。
2.根据权利要求1所述的移动终端处理语音通信的方法,其特征是,所述步骤S10中,将播放缓存区中的读指针预置在写指针之前3至10ms。
3.根据权利要求1所述的移动终端处理语音通信的方法,其特征是,所述参考值表示在正常情况下读指针与写指针的距离;采样率为8k时,所述参考值设为160;采样率为16k时,所述参考值设为320。
4.根据权利要求1所述的移动终端处理语音通信的方法,其特征是,所述阈值表示接收端的语音增强处理、解码完成所引入的波动范围;采样率为8k时,所述阈值设为8;采样率为16k时,所述阈值设为16。
5.根据权利要求1所述的移动终端处理语音通信的方法,其特征是,所述第一时间为60ms或60ms的整数倍。
6.根据权利要求1所述的移动终端处理语音通信的方法,其特征是,所述步骤S30中,所述偏移状态用来表征播放缓存区内的读指针与写指针的检测距离跟参考值相比是偏多还是偏少,偏移状态初始化为0。
7.根据权利要求1所述的移动终端处理语音通信的方法,其特征是,所述步骤S30中,所述偏移状态是8位,用于记录连续4个播放缓存区的偏移状态;每2位表示一个播放缓存区的偏移状态,二进制数10表示该播放缓存区的样本数偏多,二进制数01表示该播放缓存区的样本数偏少。
8.根据权利要求1所述的移动终端处理语音通信的方法,其特征是,所述步骤S30中,将参考值reference,阈值记为thesh,检测距离记为drift,偏移状态记为DriftState;...
【专利技术属性】
技术研发人员:李小兵,黄一火,冯子龙,许昊,
申请(专利权)人:翱捷科技上海有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。