用于窄带物联网的实时语音压缩和解压的方法技术

技术编号：21093035 阅读：65 留言：0更新日期：2019-05-11 11:15

本发明专利技术公开了一种用于窄带物联网的实时语音压缩和解压的方法，其压缩方法包括：连续实时截取总时长为t的语音数据，然后按t/2

全部详细技术资料下载

【技术实现步骤摘要】
用于窄带物联网的实时语音压缩和解压的方法
本专利技术涉及在窄带物联网中语音通信的
，更具体地说，涉及用于窄带物联网的实时语音压缩和解压的方法，以及在对讲机中的应用。
技术介绍
随着信息技术的爆炸性发展，当今的世界已经进入万物互联的时代，各种物联网技术层出不穷。但是，由于窄带物联网固有的带宽窄，传输速率低，时延较长等特点。导致使用Zigbee、LoRa以及NB-IOT等通信方式在传输语音信号时存在较大的困难，如何有效利用窄带物联网有限的带宽资源，实现数据量为22KB/s以上的语音收发，已经成为迫切需要解决的问题。1、以LoRa为例：在用LoRa技术传输数据时，如果传输的码速率小于8B/s时，传输距离可达到25公里(空旷场地)，而当码速率达到960B/s时，同等条件下的传输距离已下降至1Km以下，而一般的语音通信的数据量达到22KB/s，在未压缩的情况下，基本上无法通过LoRa的方式传输。2、Zigbee的理论带宽为256KB/s，但其所传输的数据中各种协议的数据包实际占有很大比重，能够留给语音通信用的带宽十分有限，如果不对高达22KB/s的语音数据进行压缩，即使Zigbee可以勉强传输，也会带来很大的时延。3、现有最常用的语音压缩技术为MPEG2，此技术已经非常成熟，但如果直接用于窄带无线通信时，会有以下缺陷：(1)实时性不强：MPEG2至少需要采样够一个完整的语音音节的数据后，压缩成的数据才足以保证通话质量，而一个完整的音节至少时长为0.4～0.7s，再加上通话时延，通常总通话时延至少在1s以上，而我们的实时语音压缩技术每50ms完成一帧压缩，因此在...

【技术保护点】
1.用于窄带物联网的实时语音压缩的方法，所述压缩的方法包括：连续实时截取总时长为t的语音数据，然后按t/2

【技术特征摘要】
1.用于窄带物联网的实时语音压缩的方法，所述压缩的方法包括：连续实时截取总时长为t的语音数据，然后按t/2n的间隔时间对所述语音数据取点，当取够2n个点时作为第N帧数据；将所述第N帧数据进行高频预加重，将高频预加重后的时域数据转成频域数据，再将频域数据求模计算功率谱得到频谱，以及在所述频谱中选取各次谐波幅值，并将各次谐波幅值的最大幅值除以选取各次谐波幅值的次数得到总衰减系数；将各次谐波幅值与总衰减系数相除得到4位量化的各次谐波幅度比；将所述第N帧数据和所述频谱结合进行基波分析得到基波频率值；将所述基波频率值、各次谐波幅度比和总衰减系数按照数据传输协议的帧数据格式排列生成第N帧数据的传输序码列；其中，t取20ms-60ms,n＝7、8、9；N为正整数。2.如权利要求1所述的用于窄带物联网的实时语音压缩的方法，其特征在于，所述时域数据转成频域数据的具体方式为通过傅里叶变换得到；所述基波分析具体方式为将第N帧数据和所述频谱采用最小二乘法计算每次谐波的标准间隔；所述的传输序码列通过窄带物联网传输。3.如权利要求1或2所述的用于窄带物联网的实时语音压缩的方法，其特征在于，所述在所述频谱中选取各次谐波幅值具体为：在20-2000Hz的频段中选取14个峰值点，得到第1～14次谐波的幅值，在2200—2600Hz频段中取最高幅值为第15次谐波幅值，3000-3600Hz频段取最高幅值为第16次谐波幅值，总共得到第1～16次谐波幅值；将第1～16次谐波幅值与总衰减系数相除得到4位量化的第1～16次谐波幅度比；其中，总衰减系数为取1～16次谐波幅值中的最大幅值除以16得到。4.如权利要求3所述的用于窄带物联网的实时语音压缩的方法，其特征在于，当t＝50ms，n＝8时，对所述语音数据取点的间隔时间为t/2n＝50/256ms，所述传输序码列的长度为12个字节，第1个字节作为起始码，最后1个字节作为结束码，第2个字节作为基波频率值，第3至10个字节依次作为第1～16次谐波幅度比，第11个字节作为总衰减系数。5.如权利要求1或2或4任一项所述的用于窄带物联网的实时语音压缩的方法，其特征在于，在连续实时截取总时长为t的语音数据之前，还包括将拾音器传输过来的语音信号进行预处理、增益放大、A/D转化后得到语音数据，并将语音数据存入内存，便于连续实时帧截取。6.用于窄带物联网的实时语音解压的方法，其特征...

【专利技术属性】
技术研发人员：黄洁文，袁梅，汪鹏程，梁向东，周诗围，
申请(专利权)人：桂林理工大学南宁分校，
类型：发明
国别省市：广西,45

全部详细技术资料下载我是这个专利的主人