一种语音实时变速播放方法及设备技术

技术编号：17347943 阅读：71 留言：0更新日期：2018-02-25 14:29

本发明专利技术公开了一种语音实时变速播放方法及设备，用以为在实时语音通信过程中实现语音变速播放提供解决方案。方法为：设备接收语音数据以及接收语音播放速率的控制指令；所述设备将所述语音数据保存至缓冲区，确定所述缓冲区的数据存储状态；所述设备从所述缓冲区读取待播放的语音数据，对所述待播放的语音数据进行语音活动检测获得检测结果；所述设备根据所述控制指令、所述缓冲区的数据存储状态以及所述检测结果中，调整所述待播放的语音数据的时长。

A voice real-time transmission method and equipment

The invention discloses a voice real-time variable speed playing method and device, and provides a solution for realizing voice variable speed playback in real-time voice communication process. Methods: device receives voice data and control command receiving voice playback rate; the device will save the voice data into the buffer, determining the data storage state of the buffer; the device reads the voice data to be broadcast from the buffer, the voice data of broadcast voice activity detection results; the data storage device according to the state of the control command, the buffer and the detection result, the adjustment of the audio data to be played by the length of time.

全部详细技术资料下载

【技术实现步骤摘要】
一种语音实时变速播放方法及设备
本专利技术涉及音频信号处理
，尤其涉及一种语音实时变速播放方法及设备。
技术介绍
在实时语音通信技术中，接收端播放语音的速度与发送端发送语音的速度相同。但是实际应用中，经常会存在以下场景：第一，听力有问题的人在接听电话时，例如，有听力障碍的人或老年人，经常会因为对方说话速度快而听不清对方讲话；第二，听力正常的人在接听外国人的电话时，经常会由于对一些关键信息反应不过来而无法听清对方讲话。鉴于此，需要在实时语音通信过程中实现语音变速播放。
技术实现思路
本专利技术实施例提供一种语音实时变速播放方法及设备，用以为在实时语音通信过程中实现语音变速播放提供解决方案。本专利技术实施例提供的具体技术方案如下：第一方面，本专利技术实施例提供了一种语音实时变速播放方法，包括：设备接收语音数据以及接收语音播放速率的控制指令；所述设备将所述语音数据保存至缓冲区，确定所述缓冲区的数据存储状态；所述设备从所述缓冲区读取待播放的语音数据，对所述待播放的语音数据进行语音活动检测获得检测结果；所述设备根据所述控制指令、所述缓冲区的数据存储状态以及所述检测结果中，...
一种语音实时变速播放方法及设备

【技术保护点】
一种语音实时变速播放方法，其特征在于，包括：设备接收语音数据以及接收语音播放速率的控制指令；所述设备将所述语音数据保存至缓冲区，确定所述缓冲区的数据存储状态；所述设备从所述缓冲区读取待播放的语音数据，对所述待播放的语音数据进行语音活动检测获得检测结果；所述设备根据所述控制指令、所述缓冲区的数据存储状态以及所述检测结果中，调整所述待播放的语音数据的时长。

【技术特征摘要】
1.一种语音实时变速播放方法，其特征在于，包括：设备接收语音数据以及接收语音播放速率的控制指令；所述设备将所述语音数据保存至缓冲区，确定所述缓冲区的数据存储状态；所述设备从所述缓冲区读取待播放的语音数据，对所述待播放的语音数据进行语音活动检测获得检测结果；所述设备根据所述控制指令、所述缓冲区的数据存储状态以及所述检测结果中，调整所述待播放的语音数据的时长。2.如权利要求1所述的方法，其特征在于，所述设备对所述待播放的语音数据进行语音活动检测获得检测结果，包括：所述设备对所述待播放的语音数据进行语音活动检测，确定所述语音数据中的语音段和非语音段。3.如权利要求2所述的方法，其特征在于，所述设备对所述待播放的语音数据进行语音活动检测的位置，与调整所述待播放的语音数据时长的位置的差值不大于预设阈值。4.如权利要求1所述的方法，其特征在于，所述设备调整所述待播放的语音数据的时长，包括：所述设备对所述待播放的语音数据进行时长规整。5.如权利要求1-4任一项所述的方法，其特征在于，所述设备确定所述缓冲区的数据存储状态，包括：所述设备若确定所述缓冲区的可用数据量小于或等于下限值，确定所述缓冲区的数据存储状态为第一存储状态；所述设备若确定所述缓冲区的可用数据量大于或等于上限值，确定所述缓冲区的数据存储状态为第二存储状态；所述设备若确定所述缓冲区的可用数据量大于下限值，确定小于上限值，确定所述缓冲区的数据存储状态为第三存储状态。6.如权利要求5所述的方法，其特征在于，所述设备根据所述控制指令、所述缓冲区的数据存储状态以及所述检测结果，调整所述待播放的语音数据的时长，包括：所述设备若确定所述控制指令为慢速播放，且确定所述缓冲区的数据存储状态为第三存储状态，且确定所述检测结果为语音段，加长所述待播放的语音数据的长度；所述设备若确定所述控制指令为慢速播放，且确定所述缓冲区的数据存储状态为第三存储状态，且确定所述检测结果为非语音段，缩短所述待播放的语音数据的长度；所述设备若确定所述控制指令为慢速播放，且确定所述缓冲区的数据存储状态为第一存储状态，且确定所述检测结果为语音段，加长所述语音数据信号的长度；所述设备若确定所述控制指令为慢速播放，且确定所述缓冲区的数据存储状态为第一存储状态，且确定所述检测结果为非语音段，不调整所述待播放的语音数据的长度；所述设备若确定所述控制指令为慢速播放，且确定所述缓冲区的数据存储状态为第二存储状态，且确定所述检测结果为语音段，不调整所述待播放的语音数据的长度；所述设备若确定所述控制指令为慢速播放，且确定所述缓冲区的数据存储状态为第二存储状态，且确定所述检测结果为非语音段，缩短所述待播放的语音数据的长度；所述设备若确定所述控制指令为正常速度播放，且确定所述缓冲区的数据存储状态为第一存储状态，不调整所述待播放的语音数据的长度；所述设备若确定所述控制指令为正常速度播放，且确定所述缓冲区的数据存储状态不是第一存储状态，且确定所述检测结果为语音段，不调整所述待播放的语音数据的长度；所述设备若确定所述控制指令为正常速度播放，且确定所述缓冲区的数据存储状态不是第一存储状态，且确定...

【专利技术属性】
技术研发人员：邹莹，梁民，
申请(专利权)人：电信科学技术研究院，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人