当前位置: 首页 > 专利查询>武汉大学专利>正文

一种基于隐蔽声音信号的智能手机实时通信方法技术

技术编号:14289774 阅读:55 留言:0更新日期:2016-12-25 20:00
本发明专利技术公开了一种基于隐蔽声音信号的智能手机实时通信方法,通过利用正交频分复用技术设计信号、确定子载波调制方式、分析原始音频信号确定适合嵌入数据包的位置、自适应地嵌入数据信号、包头检测、信道估计、提取信号和数据纠正等八步骤,利用人耳听觉的掩蔽效应和生活中高度易得的音频信号,在确保不影响主信道上人耳音频听觉体验的同时,实现了实时的非显性的扬声器‑麦克风数据隐蔽通信。

【技术实现步骤摘要】

本专利技术属于声学通信
,具体涉及一种基于隐蔽声音信号的智能手机实时通信方法
技术介绍
随着智能设备的流行,人们已经广泛使用这些设备获取并传播信息。同时,电子广告板、笔记本电脑等配备屏幕和扬声器的设备,已经成为方便快捷的信息来源。宽带服务公司Sandvine半年期的全球互联网现象报告中指出:在北美地区,视频和音频数据流占据了高峰时段超过70%的宽带网络流量。在这种趋势下,人们希望在用户观看(收听)视频(音频)的同时,能够向用户持有的智能设备传递其他有用的信息。例如,球迷在观看NBA直播比赛时,可以在智能设备上接收球员和球队的背景介绍和赛季表现统计数据。现有的技术通常直接显示附加信息;或者先将信息编码为可视化图像(如二维码)再显示在屏幕上,然后通过用户持有的智能设备对图像进行捕捉,并予以解码。前者将会影响用户的观看体验;对于后者,智能设备上相机的抖动、角度的偏移,用户与屏幕间的距离、障碍物、相对移动,都会影响信息获取,导致通信系统的灵活性大大降低。由于音频信号能够通过衍射和反射绕过障碍物传播,且向四面传播,因此,用音频信号作为附加信息的载体可以解决上述问题。本专利技术致力于利用人耳听觉的掩蔽效应和生活中高度易得的音频信号,研究和探索一种在扬声器和手机麦克风之间传递隐蔽信息的通信系统。人耳对音量的感知与声音信号的频率有关,其最敏感的频率范围为2~4KHz。频率偏高时,只有更高音量的声音才能被人耳察觉。同时,人的听力系统具有频域掩蔽和时域掩蔽效应。前者是指频率相近的两个信号中,音量更大的将掩蔽较小的一个。后者是指当两个信号几乎同时出现时,音量大的信号将阻碍人对音量较小信号的感知。因此,为了保障用户对原始音频信号的听觉体验,需要对其信号载体频率进行选择。音频信号的通信信道包含扬声器和麦克风,分别实现电信号到音频信号、音频信号到电信号的转换。大多数扬声器的响应频率范围为50~20000Hz,但不同的扬声器频率选择性衰落的性质不同,且在高频段性能会大幅下降。麦克风也有频率选择性衰落的性质,多数智能手机的麦克风对频率高于17KHz的声音信号无法做出响应。而人耳能够听到的声音频率范围为20~18000Hz,这一范围超过了麦克风所能响应的频率范围。因此,利用音频信号承载人耳无法感知的附加信息,需要对信号进行精细的设计。实际应用中,外界噪声干扰,音频信号的传播损耗、编码容量,附加信号的不可感知性与信息传递的鲁棒性之间的权衡等因素,都需要加以考量。
技术实现思路
为了解决上述技术问题,本专利技术提供了一种基于隐蔽声音信号的智能手机实时通信的方法。本专利技术所采用的技术方案是:一种基于隐蔽声音信号的智能手机实时通信方法,其特征在于,包括以下步骤:步骤1:利用正交频分复用技术设计信号;步骤2:确定子载波调制方式;步骤3:分析原始音频信号,确定适合嵌入数据包的位置;步骤4:自适应地嵌入数据信号;步骤5:包头检测;步骤6:信道估计;步骤7:提取信号;步骤8:数据纠正。作为优选,步骤1的具体实现包括以下子步骤:步骤1.1:选择频率在8~14.3KHz之间的64个子载波用来承载数据信息,频率在14.4~15KHz之间的7个子载波来承载控制信号;所有子载波宽度选取为100Hz;步骤1.2:根据原始音频的能量分布情况确定调制信号的方式;当原始音频大于8KHz的频谱能量密度小于3*10-2J/Hz时,利用ASK的特殊形式——通断键控(OOK)来调制信号,并在嵌入数据前删除原始音频超过8KHz的部分;否则,采用EDK来调制信号,并在嵌入数据前删除原始音频超过14.3KHz的部分;步骤1.3:将嵌入的数据流分为若干数据包,选择在持续时间的前一半内频率从fmin增大为fmax,后一半时间内减小为fmin的线性调频信号作为包头(fmin=17KHz,fmax=20KHz),并填充一段50ms的静默时间;再将数据信号分装入各数据包中,使用频率为14.5KHz的导频信号用于时间选择性估计、多普勒频移估计;在标志信号的尾部选取一段特定长度的信号作为循环前缀,用于抵抗码间干扰和载波间干扰。、作为优选,步骤2的具体实现过程是:对应信息包的音频信号,其低频段音频信号的ESD由计算得到,高频段音频信号的ESD由计算得到;其中,l为每个包里采样点数;f(KHz)代表信号频率;F(f)代表频率为f的信号的幅度;Δf(i,j)代表频率范围,即f∈[fi,fj];默认调制方法为ASK,当满足Eph>Ehigh,且时选择EDK为调制方法(Ehigh和Rhl表示两个衡量阈值,本专利技术设置Ehigh=3*10-2J/Hz,)。作为优选,步骤3的具体实现过程是:针对每一个符号相对应的音频片段,计算整个频段音频信号的能谱密度Est、音频信号的能谱密度Esl、高频段音频信号的能谱密度Esh,计算方法和信息包相同;定义阈值Emin,表示植入数据符号需要的最小音频能谱密度;当Est>Emin时才向音频片段中嵌入数据,否则不进行数据嵌入。作为优选,步骤4具体实现过程是:对于ASK方式调制的子载波,其嵌入信号的能量强度计算公式如下: E a m = 64 * β 2 E s l E s l < E m a x 64 * β 2 E m a x 本文档来自技高网
...
一种基于隐蔽声音信号的智能手机实时通信方法

【技术保护点】
一种基于隐蔽声音信号的智能手机实时通信方法,其特征在于,包括以下步骤:步骤1:利用正交频分复用技术设计信号;步骤2:确定子载波调制方式;步骤3:分析原始音频信号,确定适合嵌入数据包的位置;步骤4:自适应地嵌入数据信号;步骤5:包头检测;步骤6:信道估计;步骤7:提取信号;步骤8:数据纠正。

【技术特征摘要】
1.一种基于隐蔽声音信号的智能手机实时通信方法,其特征在于,包括以下步骤:步骤1:利用正交频分复用技术设计信号;步骤2:确定子载波调制方式;步骤3:分析原始音频信号,确定适合嵌入数据包的位置;步骤4:自适应地嵌入数据信号;步骤5:包头检测;步骤6:信道估计;步骤7:提取信号;步骤8:数据纠正。2.根据权利要求1所述的基于隐蔽声音信号的智能手机实时通信方法,其特征在于,步骤1的具体实现包括以下子步骤:步骤1.1:选择频率在8~14.3KHz之间的64个子载波用来承载数据信息,频率在14.4~15KHz之间的7个子载波来承载控制信号;所有子载波宽度选取为100Hz;步骤1.2:根据原始音频的能量分布情况确定调制信号的方式;当原始音频大于8KHz的频谱能量密度小于3*10-2J/Hz时,利用ASK的特殊形式——通断键控来调制信号,并在嵌入数据前删除原始音频超过8KHz的部分;否则,采用EDK来调制信号,并在嵌入数据前删除原始音频超过14.3KHz的部分;步骤1.3:将嵌入的数据流分为若干数据包,选择在持续时间的前一半内频率从fmin增大为fmax,后一半时间内减小为fmin的线性调频信号作为包头,并填充一段50ms的静默时间;再将数据信号分装入各数据包中,使用频率为14.5KHz的导频信号用于时间选择性估计、多普勒频移估计;在标志信号的尾部选取一段特定长度的信号作为循环前缀,用于抵抗码间干扰和载波间干扰。3.根据权利要求1所述的基于隐蔽声音信号的智能手机实时通信方法,其特征在于,步骤2的具体实现过程是:对应信息包的音频信号,其低频段音频信号的ESD由计算得到,高频段音频信号的ESD由计算得到;其中,l为每个包里采样点数;f(KHz)代表信号频率;F(f)代表频率为f的信号的幅度;Δf(i,j)代表频率范围,即f∈[fi,fj];默认调制方法为ASK,当满足Eph>Ehigh,且时选择EDK为调制方法;其中,Ehigh和Rhl表示两个衡量阈值。4.根据权利要求1所述的基于隐蔽声音信号的智能手机实时通信方法,其特征在于,步骤3的具体实现过程是:针对每一个符号相对应的音频片段,计算整个频段音频信号的能谱密度Est、音频信号的能谱密度Esl、高频段音频信号的能谱密度Esh,计算方法和信息包相同;定义阈值Emin,表示植入数据符号需要的最小音频能谱密度;当Est>Emin时才向音频片段中嵌入数据,否则不进行数据嵌入。5.根据权利要求1所述的基于隐蔽声音信号的智能手机实时通信方法,其特征在于,步骤4具体实现过程是:对于ASK方式调制的子载波,其嵌入信号的能量强度计算公式如下: E a m = 64 * β 2 E s l E s l < E m a x 64 * β 2 E m a x E s l ≥ E m a x ]]>对于EDK方式调制的子载波,其嵌入信号的强度计算公式如下: E e n = 64 * β 2 E s l B s i E s l < E m a x ...

【专利技术属性】
技术研发人员:王骞周满张明雪陈秀颖
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1