用于防止语音延迟的语音数据处理装置及方法制造方法及图纸

技术编号：20518673 阅读：37 留言：0更新日期：2019-03-06 03:03

本发明专利技术公开一种用于防止语音延迟的语音数据处理装置及方法。根据本发明专利技术的一实施例的语音数据处理装置包括：接收部，接收语音数据；存储部，将接收的所述语音数据存储于缓冲区；区间分类部，将存储的所述语音数据分割为一个以上的区间，并将被分割的所述一个以上的区间分别分类为语音区间或静音区间；语音输出部，将分类为所述静音区间的语音数据丢弃或者加速播放速度而输出。

Speech Data Processing Device and Method for Preventing Speech Delay

The invention discloses a voice data processing device and method for preventing voice delay. According to an embodiment of the present invention, a voice data processing device includes: a receiving unit that receives voice data; a storage unit that stores the received voice data in a buffer; an interval classification unit that divides the stored voice data into more than one interval and classifies more than one interval divided into voice interval or mute interval, respectively; and a voice output unit. The voice data classified as the silent interval is discarded or output by accelerating the playback speed.

全部详细技术资料下载

【技术实现步骤摘要】
用于防止语音延迟的语音数据处理装置及方法
本专利技术的实施例涉及一种用于防止语音延迟的语音数据处理装置及方法。
技术介绍
通常，通过网络接收语音而实时输出的装置(例如，语音流装置、互联网协议电话(VoiceoverInternetProtocol；VoIP)装置等)在例如产生丢包、包延迟等问题的情况下，无法顺利地输出语音数据。为了解决上述问题，开发了如下的技术：将接收的语音数据存储于抖动缓冲区(JitterBuffer)，在抖动缓冲区存储预定量以上的语音数据以后输出语音数据。但是，在产生过度的由于发送装置或接收装置的过负荷引起的延迟(例如，发送端或接收端侧的计算机CPU(CentralProcessingUnit)过负荷引起的延迟)、由网络环境引起的延迟等的情况下，依然存在无法顺利输出语音数据的问题。
技术实现思路
本专利技术的实施例的目的在于在没有音质损失的情况下防止语音发生延迟，从而将语音数据顺利输出。根据本专利技术的一实施例的语音数据处理装置包括：接收部，接收语音数据；存储部，将接收的所述语音数据存储于缓冲区；区间分类部，将存储的所述语音数据分割为一个以上的区间，并将被分割的所述一个以上的区间分别分类为语音区间或静音区间；语音输出部，将被分类为所述静音区间的语音数据丢弃或者加速播放速度而输出。根据本专利技术的一实施例的语音数据处理装置还包括：语音延迟判断部，将存储的所述语音数据的大小与设定的基准值进行比较而判断是否产生语音延迟，在由所述语音延迟判断部判断为产生了语音延迟的情况下，所述语音输出部可以将被分类为所述静音区间的语音数据丢弃或者加速播放速度而输出...

【技术保护点】
1.一种语音数据处理装置，包括：接收部，接收语音数据；存储部，将接收的所述语音数据存储于缓冲区；区间分类部，将存储的所述语音数据分割为一个以上的区间，并将被分割的所述一个以上的区间分别分类为语音区间或静音区间；语音输出部，将被分类为所述静音区间的语音数据丢弃或者加速播放速度而输出。

【技术特征摘要】
2017.09.01 KR 10-2017-01118471.一种语音数据处理装置，包括：接收部，接收语音数据；存储部，将接收的所述语音数据存储于缓冲区；区间分类部，将存储的所述语音数据分割为一个以上的区间，并将被分割的所述一个以上的区间分别分类为语音区间或静音区间；语音输出部，将被分类为所述静音区间的语音数据丢弃或者加速播放速度而输出。2.如权利要求1所述的语音数据处理装置，其中，还包括：语音延迟判断部，将存储的所述语音数据的大小与设定的基准值进行比较而判断是否产生语音延迟，在由所述语音延迟判断部判断为产生了语音延迟的情况下，所述语音输出部将被分类为所述静音区间的语音数据丢弃或者加速播放速度而输出。3.如权利要求1所述的语音数据处理装置，其中，还包括：静音区间测量部，测量静音区间的持续时间，在所述静音区间的持续时间超过设定的第一基准时间及设定的第二基准时间的情况下，所述语音输出部将被分类为所述静音区间的语音数据丢弃。4.如权利要求1所述的语音数据处理装置，其中，还包括：静音区间测量部，测量静音区间的持续时间，在所述静音区间的持续时间超过设定的第一基准时间且为设定的第二基准时间以下的情况下，所述语音输出部将被分类...

【专利技术属性】
技术研发人员：金商范，赵相范，姜俊豪，申成勋，尹熙兑，
申请(专利权)人：三星SDS株式会社，
类型：发明
国别省市：韩国,KR

全部详细技术资料下载我是这个专利的主人