数字音频信号处理的方法技术

技术编号:14658202 阅读:122 留言:0更新日期:2017-02-16 23:55
本发明专利技术公开了一种数字音频信号处理的方法,通过向数字音频信号嵌入一定形态的其他内容,来实现隐秘地传递数字信息的目的,主要是利用人耳听觉系统的掩蔽效应,使数字音频信号携带预定数据。采用本发明专利技术的方法,可以在一数字音频信号的合适位置,嵌入需要传递的数据。该数字音频信号被播放时,能够掩蔽掉嵌入位置上所嵌入的用于表达有关数据信息的音频信号,使其不为人耳所察觉,却能被具有音频信号处理能力的设备所接收。

【技术实现步骤摘要】

本专利技术涉及一种数字音频信号处理技术,尤其涉及一种基于心理声学,利用掩蔽效应的,数字音频信号处理的方法
技术介绍
利用数字音频信号来携带信息是业界广为关注并投入相当人力和财力进行研究和开发的技术。利用这样的技术,人们可以一边正常地收听音乐、收看电视节目,一边利用具有音频信号处理能力的设备,例如:移动通信终端,来获取前述的音乐或者电视节目中所携带的数据信息。评价这种技术是否成熟和适于应用的一个重要特性就是:这种技术应当既要保证被携带的数据能够被准确地采集、传递,又要保证数字音频信号本身被播放时,不会产生人类能够感受到的干扰音或者噪音。中国专利申请201410301832.7公开这样的一种技术:将需要传输的数字信息经过编码调制形成声音编码信号;将该声音编码信号与预选的音视频节目中的音频信号进行混音后输出。虽然,利用该技术能够将“需要传输的数字信息”以混音的方式加入到正常的声音之中;但是,由于“需要传输的数字信息”的不可预知性,“需要传输的数字信息”经过编码调制所形成的声音编码信号在相当多的情况下可能是声音中的噪音。在另外的一些情况下,可能是能够对正常播放的声音造成干扰的其他声音。为了避免这样的问题,在上述专利申请的说明书部分提出了如下的改进方案:“将需要传输的数字信息经过编码调制形成声音编码信号。该声音编码信号可以写成数字声音信号文件,也可以经过数模转换器转换成声音模拟信号,该声音模拟信号的频率可选择位于18kHz以上、20kHz以下的频段,该频段人耳难以察觉,不会影响原有电视伴音或音乐信号的正常播放。因为在后续的步骤中,需要由用户本地的接收设备进行接收和提取需要传输的数字信息,所以该声音编码信息需具有一定的特征,该特征是信号能量分布仅在一定频率范围内:18kHz以上,20kHz以下。”显然,上述的方案为了避免人耳察觉用“需要传输的数字信息”形成的声音编码,而必须使这部分声音编码信息的能量分布被设置在18kHz~20kHz这个频率范围之内。众多周知:人耳能够听到的声音的整个范围是20Hz~20kHz。听觉良好的成年人能听到的声音频率常在30Hz~16kHz之间;听力较差的老年人能听到的声音频率则常在50Hz~10kHz之间。然而,儿童能听到的声音频率通常会更高。上述技术方案中所采用的18Hz~20kHz频率范围的声音是许多儿童能够听到的。因此,即使选择性地将声音编码信息的能量分布在18Hz~20kHz这个频率范围之内,也会使得相当多的人,特别是儿童还能听到;这使得这些人,特别是儿童在聆听含有使用该技术进行声音编码电视、广播节目时,依然会受到噪音或者干扰音的困扰。另一方面,选择性地将声音编码信息的能量分布在人耳能够听到频率范围(20Hz~20kHz)之外虽然能够实现,但由于绝大多数音响设备的频率响应特性是依据人耳能听到的声音范围设计制造的,对于20Hz~20kHz频率范围之外的音频信号,一般都会被当作杂音或者噪音滤掉,因此,声音编码信息即使能够被混音到正常的音频信号之中,却并不能被音响设备所播放,因而也不可能被接受设备所获取。综上,上述的各种技术显然并不成熟,因此也不可能得到广泛的应用。
技术实现思路
本专利技术的目的是提供一种数字音频信号处理的方法,利用心理声学原理来对所述的数字音频信号进行处理,将需要传送的信息,以特定的目标数据嵌入到该数字音频信号之中,使得该数字音频信号被音响设备播出时,被嵌入的目标数据也能一并被播出,在不为人耳所察觉的情况下,却能被具有音频信号处理能力的设备所接收和提取。本专利技术的上述目的是采用这样的技术方案实现的:将第一数字音频信号分帧为多个音频帧数据并进行加窗处理;对前述多个音频帧数据分别进行频域离散傅立叶(Fourier)变换,得到与前述多个音频帧数据分别对应的多个第一频谱数据;将前述多个第一频谱数据映射到听觉临界频带(Bark域),并计算听觉临界频带中各个子带的掩蔽阈值;该掩蔽阈值的数量与前述的子带的数量是一一对应的;在前述多个第一频谱数据中选取小于前述掩蔽阈值的频率点作为嵌入位置;采用可对量化结果实现盲检测的量化器对目标数据进行量化处理,并用量化处理的结果赋值前述的嵌入位置处的离散傅里叶系数,因此获得与前述多个第一频谱数据对应的多个第二频谱数据;对前述多个第二频谱数据进行离散傅立叶逆变换,获得第二数字音频信号。采用本专利技术的上述方法,可以根据心理声学的原理,在第一数字音频信号的合适位置,嵌入需要传递的目标数据。当该第一数字音频信号被播放时,能够掩蔽掉嵌入位置上所嵌入的用于表达有关目标数据的信号,使其不为人耳所察觉,但是,这些被嵌入的信号却能被具有音频信号处理能力的设备所侦听和还原。本专利技术的另一个目的是提供一种从数字音频信号中提取数据的方法;利用该方法,能够在数字音频信号被音响设备播出时,对接收到的数字音频信号进行处理,利用心理声学原理提取嵌入其中的目标数据。将接收到的第一数字音频信号分帧为多个音频帧数据,并进行加窗处理;对前述多个音频帧数据进行频域离散傅立叶变换,得到与前述多个音频帧数据分别对应的多个第一频谱数据;将前述多个第一频谱数据映射到听觉临界频带,并计算听觉临界频带中各子带的掩蔽阈值;前述的掩蔽阈值的数量与前述的子带的数量一一对应;选取前述多个第一频谱数据中小于相应的掩蔽阈值的频率点作为嵌入位置;采用可对量化结果实现盲检测的量化器对前述嵌入位置处的离散傅里叶系数进行反量化处理,获得前述第一数字音频信号中嵌入的目标数据序列;其中,该目标数据序列是由一个以上特定的音频数据和/或编码数据按照预定的顺序串行排列而成;该等特定的音频频域信号与特定的响度和/或特定的音高和/或音色相对应。本专利技术上述的方法,能够在接收到的第一数字音频信号时,利用心理声学原理从中提取出利用掩蔽效应通过该第一数字音频信号携带的目标数据序列,并进一步恢复出相应的目标数据;而在这一过程中,尽管被嵌入的目标数据序列能够与该数字音频信号一并被音响设备播出,但却不为人耳所察觉。具体实施方式在本专利技术的第一类具体实施方式中,需要向目标数字音频信号中嵌入一些目标数据。为了在一个数字音频信号中嵌入上述的目标数据,需要将数字音频信号分帧为多个音频帧数据,并在此基础上对各个音频帧数据进行加窗处理。然后,对经过加窗处理的各个音频帧数据进行频域离散傅立叶变换,能够得到与前述各个音频帧数据分别一一对应的多个第一频谱数据。在得到前述多个第一频谱数据后,需要将这些第一频谱数据分别映射到听觉临界频带,并计算该听觉临界频带中各子带的掩蔽阈值;这些掩蔽阈值的数量与听觉临界频带的子带的数量是对应的。在上述多个第一频谱数据中,均选取其中小于前述掩蔽阈值的频率点作为目标数据的嵌入位置;然后,采用可对量化结果实现盲检测的量化器对前述的目标数据进行量化处理,并用量化处理后得到的结果,对前述嵌入位置的离散傅里叶系数赋值(替换),因此可以获得与前述各个第一频谱数据分别对应的各个第二频谱数据;对该等多个第二频谱数据进行离散傅立叶逆变换,就可以获得第二数字音频信号。这个新获得的第二数字音频信号中嵌入有上述的目标数据。需要说明的是:在对第一数字音频信号进行分帧、加窗等处理时,可以由相关的技术人员根据具体的设计要求来确本文档来自技高网
...

【技术保护点】
一种数字音频信号处理的方法,包括:将第一数字音频信号分帧为多个音频帧数据并进行加窗处理;对所述多个音频帧数据进行频域离散傅立叶变换,得到与所述多个音频帧数据分别对应的多个第一频谱数据;将所述多个第一频谱数据映射到听觉临界频带,并计算听觉临界频带中各子带的掩蔽阈值;所述掩蔽阈值的数量与所述子带的数量对应;选取所述多个第一频谱数据中小于所述掩蔽阈值的频率点作为嵌入位置;采用可对量化结果实现盲检测的量化器对目标数据进行量化处理,并用量化处理的结果赋值所述嵌入位置的离散傅里叶系数,获得与所述多个第一频谱数据对应的多个第二频谱数据;对所述多个第二频谱数据进行离散傅立叶逆变换,获得第二数字音频信号。

【技术特征摘要】
1.一种数字音频信号处理的方法,包括:将第一数字音频信号分帧为多个音频帧数据并进行加窗处理;对所述多个音频帧数据进行频域离散傅立叶变换,得到与所述多个音频帧数据分别对应的多个第一频谱数据;将所述多个第一频谱数据映射到听觉临界频带,并计算听觉临界频带中各子带的掩蔽阈值;所述掩蔽阈值的数量与所述子带的数量对应;选取所述多个第一频谱数据中小于所述掩蔽阈值的频率点作为嵌入位置;采用可对量化结果实现盲检测的量化器对目标数据进行量化处理,并用量化处理的结果赋值所述嵌入位置的离散傅里叶系数,获得与所述多个第一频谱数据对应的多个第二频谱数据;对所述多个第二频谱数据进行离散傅立叶逆变换,获得第二数字音频信号。2.根据权利要求1所述的方法,其特征在于,所述目标数据采用如下步骤获得:获取一个以上特定的音频数据和/或编码数据,并使所述一个以上特定的音频数据和/或编码数据按照预定的顺序串行排列为一个目标数据序列;或者,获取一个以上特定的音频数据和/或编码数据,并使所述一个以上特定的音频数据和/或编码数据按照预定的顺序串行排列为一个目标数据序列;并且在所述目标数据序列的预定位置,插入预定的标识数据序列;所述的标识数据序列由预定的编码数据按照约定的长度和顺序排列而成;其中,所述特定的音频数据与特定的响度和/或特定的音高和/或音色相对应。3.根据权利要求1或2所述的方法,其特征在于,所述采用可对量化结果可实现盲检测的量化器对目标数据进行量化处理,并用量化处理的
\t结果赋值所述嵌入位置的离散傅里叶系数,具体包括:基于所述的嵌入位置,根据音频帧数据的掩蔽阈值,计算出相应的嵌入强度,以确定在相应的音频帧数据中所嵌入的数据量;根据所述的嵌入强度,采用可对量化结果可实现盲检测的量化器...

【专利技术属性】
技术研发人员:李庆成鹿毅忠
申请(专利权)人:北京音图数码科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1