用于窄带物联网的实时语音压缩和解压的方法技术

技术编号:21093035 阅读:65 留言:0更新日期:2019-05-11 11:15
本发明专利技术公开了一种用于窄带物联网的实时语音压缩和解压的方法,其压缩方法包括:连续实时截取总时长为t的语音数据,然后按t/2

【技术实现步骤摘要】
用于窄带物联网的实时语音压缩和解压的方法
本专利技术涉及在窄带物联网中语音通信的
,更具体地说,涉及用于窄带物联网的实时语音压缩和解压的方法,以及在对讲机中的应用。
技术介绍
随着信息技术的爆炸性发展,当今的世界已经进入万物互联的时代,各种物联网技术层出不穷。但是,由于窄带物联网固有的带宽窄,传输速率低,时延较长等特点。导致使用Zigbee、LoRa以及NB-IOT等通信方式在传输语音信号时存在较大的困难,如何有效利用窄带物联网有限的带宽资源,实现数据量为22KB/s以上的语音收发,已经成为迫切需要解决的问题。1、以LoRa为例:在用LoRa技术传输数据时,如果传输的码速率小于8B/s时,传输距离可达到25公里(空旷场地),而当码速率达到960B/s时,同等条件下的传输距离已下降至1Km以下,而一般的语音通信的数据量达到22KB/s,在未压缩的情况下,基本上无法通过LoRa的方式传输。2、Zigbee的理论带宽为256KB/s,但其所传输的数据中各种协议的数据包实际占有很大比重,能够留给语音通信用的带宽十分有限,如果不对高达22KB/s的语音数据进行压缩,即使Zigbee可以勉强传输,也会带来很大的时延。3、现有最常用的语音压缩技术为MPEG2,此技术已经非常成熟,但如果直接用于窄带无线通信时,会有以下缺陷:(1)实时性不强:MPEG2至少需要采样够一个完整的语音音节的数据后,压缩成的数据才足以保证通话质量,而一个完整的音节至少时长为0.4~0.7s,再加上通话时延,通常总通话时延至少在1s以上,而我们的实时语音压缩技术每50ms完成一帧压缩,因此在通话的实时性上远强于MPEG2。(2)压缩比不足:MPEG2的压缩率是12:1--10:1,压缩比不足无法在窄带物联网中实时语音传输技术。对22KB/s速度的语音数据,在每次截取压缩总时长为20ms的语音数据时,我们的实时语音功率谱压缩技术可达40:1,甚至更高的压缩比,22KB/s能压缩在0.6KB/s以内,可实现窄带物联网的语音实时通畅通信。
技术实现思路
本专利技术的一个目的是解决至少上述缺陷,并提供至少后面将说明的优点。为了实现根据本专利技术的这些目的和其它优点,本专利技术提供一种用于窄带物联网的实时语音压缩和解压的方法,其通过对连续实时截取总时长为t的语音数据进行均匀取点组成帧数据,再对帧数据转成频域数据,进行求模计算功率谱等对语音数据的压缩处理得到各次谐波幅度比、基波频率值和总衰减系数的三种重要数值,并将三种重要数值按照数据传输协议的帧数据格式排列生成传输序码列即得到压缩比高的语音信号。并且是连续实时截取压缩,使得说话过程中每设定的t时间压缩出一帧数据,延时小,不易被察觉,实时性较好。并针对压缩的方法得到对应的解压方法,将压缩的语音信号还原播放,实现数据量为22KB/s以上的语音在窄带物联网上通畅实时收发,极大保留了通话时的语音质量。本专利技术提供一种用于窄带物联网的实时语音压缩的方法,所述压缩的方法包括:连续实时截取总时长为t的语音数据,然后按t/2n的间隔时间对所述语音数据取点,当取够2n个点时作为第N帧数据;将所述第N帧数据进行高频预加重,将高频预加重后的时域数据转成频域数据,再将频域数据求模计算功率谱得到频谱,以及在所述频谱中选取各次谐波幅值,并将各次谐波幅值的最大幅值除以选取各次谐波幅值的次数得到总衰减系数;将各次谐波幅值与总衰减系数相除得到4位量化的各次谐波幅度比;将所述第N帧数据和所述频谱结合进行基波分析得到基波频率值;将所述基波频率值、各次谐波幅度比和总衰减系数按照数据传输协议的帧数据格式排列生成第N帧数据的传输序码列;其中,t取20ms-60ms,n=7、8、9;N为正整数。优选的是,所述时域数据转成频域数据的具体方式为通过傅里叶变换得到;所述基波分析具体方式为将第N帧数据和所述频谱采用最小二乘法计算每次谐波的标准间隔;所述的传输序码列通过窄带物联网传输。优选的是,所述在所述频谱中选取各次谐波幅值具体为:在20-2000Hz的频段中选取14个峰值点,得到第1~14次谐波的幅值,在2200—2600Hz频段中取最高幅值为第15次谐波幅值,3000-3600Hz频段取最高幅值为第16次谐波幅值,总共得到第1~16次谐波幅值;将第1~16次谐波幅值与总衰减系数相除得到4位量化的第1~16次谐波幅度比;其中,总衰减系数为取1~16次谐波幅值中的最大幅值除以16得到。优选的是,当t=50ms,n=8时,对所述语音数据取点的间隔时间为t/2n=50/256ms,所述传输序码列的长度为12个字节,第1个字节作为起始码,最后1个字节作为结束码,第2个字节作为基波频率值,第3至10个字节依次作为第1~16次谐波幅度比,第11个字节作为总衰减系数。优选的是,在连续实时截取总时长为t的语音数据之前,还包括将拾音器传输过来的语音信号进行预处理、增益放大、A/D转化后得到语音数据,并将语音数据存入内存,便于连续实时帧截取。本专利技术还提供一种用于窄带物联网的实时语音解压的方法,其包括:对窄带物联网发送过来的传输序码列进行连续实时接收,接收的传输序码列与压缩方法中的数据传输协议的帧数据格式相同;将接收的传输序码列按数据传输协议的帧数据格式分离出第N帧数据的基波频率值、各次谐波幅度比以及总衰减系数;将各次谐波幅度比与总衰减系数相乘后得到各次谐波幅值;将各次谐波幅值与基波频率值进行反傅里叶变换,生成时域上的语音数据;将语音数据去高频预加重,再D/A转化后得到语音信号。优选的是,将D/A转化后的语音信号经过功率放大后,传输给语音播放器发声。本专利技术通过使用上述的语音压缩和解压的方法,提供一种单模块数据处理的对讲机系统,其包括:选择匹配对讲机模块,其用于选定需要语音通讯的其他对讲机;拾音器,其用于将声音振动转换成模拟语音信号;共用ISD9160芯片的压缩和解压模块,其用于实时接收拾音器传输过来的模拟语音信号,并将模拟语音信号AD转化为语音数据,然后将语音数据进行压缩得到传输序码列,以及用于实时采样LoRa无线模块接收的其他对讲机的传输序码列进行解压;LoRa无线模块,其用于将压缩和解压模块的传输序码列无线发送给窄带物联网传输,传输给其他对讲机接收,以及用于将从窄带物联网传输过来的其他对讲机的传输序码列无线接受给压缩和解压模块;切换收发模块,其用于选择LoRa无线模块处于无线发送状态还是无线接收状态;语音播放器,其用于将压缩和解压模块解压后的语音信号播放发声;稳压电源模块,其用于给对讲机系统提供电源。本专利技术通过使用上述的语音压缩和解压的方法,提供一种双模块数据处理的对讲机系统,其包括:选择匹配对讲机模块,其用于选定需要语音通讯的其他对讲机;拾音器,其用于将声音振动转换成模拟语音信号;压缩模块,其用于实时接收拾音器传输过来的模拟语音信号,并将模拟语音信号AD转化为语音数据,然后将语音数据进行压缩得到传输序码列;LoRa无线发送模块,其用于将压缩模块的传输序码列无线发送给窄带物联网,传输给其他对讲机接收;LoRa无线接收模块,其用于将从窄带物联网传输过来的其他对讲机的传输序码列无线接受给解压模块;解压模块,其用于实时接受LoRa无线接收模块传输的其他对讲机的传输序码列进行解压;本文档来自技高网
...

【技术保护点】
1.用于窄带物联网的实时语音压缩的方法,所述压缩的方法包括:连续实时截取总时长为t的语音数据,然后按t/2

【技术特征摘要】
1.用于窄带物联网的实时语音压缩的方法,所述压缩的方法包括:连续实时截取总时长为t的语音数据,然后按t/2n的间隔时间对所述语音数据取点,当取够2n个点时作为第N帧数据;将所述第N帧数据进行高频预加重,将高频预加重后的时域数据转成频域数据,再将频域数据求模计算功率谱得到频谱,以及在所述频谱中选取各次谐波幅值,并将各次谐波幅值的最大幅值除以选取各次谐波幅值的次数得到总衰减系数;将各次谐波幅值与总衰减系数相除得到4位量化的各次谐波幅度比;将所述第N帧数据和所述频谱结合进行基波分析得到基波频率值;将所述基波频率值、各次谐波幅度比和总衰减系数按照数据传输协议的帧数据格式排列生成第N帧数据的传输序码列;其中,t取20ms-60ms,n=7、8、9;N为正整数。2.如权利要求1所述的用于窄带物联网的实时语音压缩的方法,其特征在于,所述时域数据转成频域数据的具体方式为通过傅里叶变换得到;所述基波分析具体方式为将第N帧数据和所述频谱采用最小二乘法计算每次谐波的标准间隔;所述的传输序码列通过窄带物联网传输。3.如权利要求1或2所述的用于窄带物联网的实时语音压缩的方法,其特征在于,所述在所述频谱中选取各次谐波幅值具体为:在20-2000Hz的频段中选取14个峰值点,得到第1~14次谐波的幅值,在2200—2600Hz频段中取最高幅值为第15次谐波幅值,3000-3600Hz频段取最高幅值为第16次谐波幅值,总共得到第1~16次谐波幅值;将第1~16次谐波幅值与总衰减系数相除得到4位量化的第1~16次谐波幅度比;其中,总衰减系数为取1~16次谐波幅值中的最大幅值除以16得到。4.如权利要求3所述的用于窄带物联网的实时语音压缩的方法,其特征在于,当t=50ms,n=8时,对所述语音数据取点的间隔时间为t/2n=50/256ms,所述传输序码列的长度为12个字节,第1个字节作为起始码,最后1个字节作为结束码,第2个字节作为基波频率值,第3至10个字节依次作为第1~16次谐波幅度比,第11个字节作为总衰减系数。5.如权利要求1或2或4任一项所述的用于窄带物联网的实时语音压缩的方法,其特征在于,在连续实时截取总时长为t的语音数据之前,还包括将拾音器传输过来的语音信号进行预处理、增益放大、A/D转化后得到语音数据,并将语音数据存入内存,便于连续实时帧截取。6.用于窄带物联网的实时语音解压的方法,其特征...

【专利技术属性】
技术研发人员:黄洁文袁梅汪鹏程梁向东周诗围
申请(专利权)人:桂林理工大学南宁分校
类型:发明
国别省市:广西,45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1