一种听觉无感的音频模拟水印加注方法及装置制造方法及图纸

技术编号:38194880 阅读:13 留言:0更新日期:2023-07-20 21:15
本发明专利技术提出了一种听觉无感的音频模拟水印加注方法及装置,方法包括:获取音频文件,并对音频文件进行傅里叶变换处理;基于分配的水印频段,在当前的音频文件的对应频段中添加水印;对当前音频文件进行逆傅里叶变换,以获得加注水印后的音频文件。本发明专利技术利用以锚点频率为中心的30Hz频带能量作为水印二进制数字标记,由于频带宽度有限,遮掩效应会使该频带周边频率信号弥补人耳对该频段能量修改的感知;同时进一步利用逆梅尔刻度的设计,将锚点频率选定在了3000

【技术实现步骤摘要】
一种听觉无感的音频模拟水印加注方法及装置


[0001]本专利技术涉及音频水印
,尤其涉及一种听觉无感的音频模拟水印加注方法及装置。

技术介绍

[0002]音频水印的一个重要功能是对音频来源进行溯源,对保密音频进行标记,防止泄密被转录。另一方面,随着人工智能语音合成技术的进步,对合成音频的管理也可以利用音频水印的方法来加强。
[0003]从技术上讲,相对于语音信号而言图像和视频都可以很容易通过水印的形式对信息进行标记。人在观察图片或视频的过程中,对信息的感知具有局部集中的特点,所以在图片或视频非关键区域加注水印,类似于电视台台标的标记方式,基本不会影响其使用效果。而相对于图片和视频,人类在接收语音信号时对语音信号是全局性关注的,对语音信号加注水印信息需要注意不影响语音整体听感。
[0004]现有音频水印多是在数字信号处理中加入水印。其中的典型电表是LSB(二进制编码比特,least important bits)水印加注法,这种方法在音频的二进制数据中进行水印加注。该方法利用一定的规则,在对音频听感影响最小的LSB中对音频信号进行修改。在音频水印加注过程中,首先将音频的每个数据转化成二进制,并在最低位插入水印数据。在提取水印时,利用规则解读隐藏LSB中的水印信息。
[0005]然而,音频数字水印有一个明显的缺点,数字水印会因语音在通信传播过程中因为编解码流程受到影响,也会因为语音信号在空气中传播的转录而消失。音频转码和空气传播是音频传播过程中的典型场景。因此,数字音频水印的使用场景范围极为有限。
[0006]目前,也有一种音频模拟水印的加注方法,及每隔一段时间在音频中添加版权播报语音。这种方法常见于音乐试听中,在播放音频文件时,每隔一段时间会播放如“本音频版权属于某某机构”等提示音,如果采用这种方法对普遍的音频文件进行水印加注,将影响听感,因此使用场景也非常窄。
[0007]传统音频数字水印有一个明显的缺点,数字水印会因语音在通信传播过程中因为编解码流程受到影响,也会因为语音信号在空气中传播的转录而消失。音频转码和空气传播是音频传播过程中的典型场景。因此,数字音频水印的效果和使用场景极为有限。而在音频中添加播报语音的水印方法也因对音频的听感影响明显而不可广泛应用。

技术实现思路

[0008]本专利技术要解决的技术问题是,如何在有效添加音频水印的前提下,使得添加的模拟水印不影响人耳对加注水印后的音频信号的听感。有鉴于此,本专利技术提供一种听觉无感的音频模拟水印加注方法及装置、电子设备。
[0009]本专利技术采用的技术方案是,所述一种听觉无感的音频模拟水印加注方法,包括:步骤S1,获取音频文件,并对所述音频文件进行傅里叶变换处理;
步骤S2,基于分配的水印频段,在当前的音频文件的对应频段中添加水印;步骤S3,对当前音频文件进行逆傅里叶变换,以获得加注水印后的音频文件。
[0010]在一个实施方式中,所述基于分配的水印频段,在当前的音频文件的对应频段中添加水印,包括:获取水印内容;基于配置的编码规则,对所述水印内容进行水印编码;在预设的频率区间内,呈逆梅尔刻度分布设置有至少两处锚点频率,即添加水印的频率;基于预设的添加规则,将编码后的所述水印内容添加至所述锚点频率。
[0011]在一个实施方式中,所述基于配置的编码规则,对所述水印内容进行水印编码,包括:数字编码或数字与汉字相结合编码之中的至少一种。
[0012]在一个实施方式中,所述预设的频率区间包括:3000Hz到4500Hz。
[0013]在一个实施方式中,所述在预设的频率区间内,呈逆梅尔刻度分布设置有至少两处锚点频率,即添加水印的频率,包括:在所述预设频率区间内呈逆梅尔刻度分步设置14处锚点频率;其中,第一锚点的频率配置为3000Hz,第二锚点的频率配置为3138Hz,第三锚点的频率配置为3272Hz,第四锚点的频率配置为3402Hz,第五锚点的频率配置为3528Hz,第六锚点的频率配置为3650Hz,第七锚点的频率配置为3768Hz,第八锚点的频率配置为3883Hz,第九锚点的频率配置为3993Hz,第十锚点的频率配置为4101Hz,第十一锚点的频率配置为4206Hz,第十二锚点的频率配置为4307Hz,第十三锚点的频率配置为4405Hz,第十四锚点的频率配置为4500Hz。
[0014]在一个实施方式中,所述基于预设的添加规则,将编码后的所述水印内容添加至所述锚点频率:将所述水印内容进行数字编码后的四位数十进制编码转换为描点数量位的二进制编码,所述二进制编码中的每一位表征一锚点;其中,当锚点的频率对应的二进制编码为0时,以锚点频率为中频率的30Hz的频带能量归零;当锚点频率对应二进制编码为1时,不做处理。
[0015]在一个实施方式中,所述方法还包括:在所述水印内容所在音频时域的起始处添加起始标记,终止处添加终止标记。
[0016]本专利技术的另一方面还提供了一种听觉无感的音频模拟水印加注装置,包括:获取单元,被配置为获取音频文件,并对所述音频文件进行傅里叶变换处理;添加单元,被配置为基于分配的水印频段,在当前的音频文件的对应频段中添加水印;输出单元,被配置为对当前音频文件进行逆傅里叶变换,以获得加注水印后的音频文件。
[0017]本专利技术的另一方面还提供了一种电子设备,所述电子设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上任一项所述的听觉无感的音频模拟水印加注方法的步骤。
[0018]本专利技术的另一方面还提供了一种计算机存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上任一项所述的听觉无感的音频模拟水印加注方法的步骤。
[0019]采用上述技术方案,本专利技术至少具有下列优点:本专利技术提供的一种听觉无感的音频模拟水印加注方法,利用以锚点频率为中心的30Hz频带能量作为水印二进制数字标记,由于频带宽度有限,遮掩效应会使该频带周边频率信号弥补人耳对该频段能量修改的感知;同时进一步利用逆梅尔刻度的设计,将锚点频率选定在了3000

4500Hz的频率范围,人类对该段频率敏感度较小,进一步降低了加注水印对音频信号听感的影响。
附图说明
[0020]图1为根据本专利技术实施例的听觉无感的音频模拟水印加注方法流程图;图2为根据本专利技术实施例的听觉无感的音频模拟水印加注方法逻辑示意图;图3为根据本专利技术实施例的水印时频示意图;图4为根据本专利技术实施例的听觉无感的音频模拟水印加注装置组成结构示意图;图5为根据本专利技术实施例的电子设备构成示意图。
具体实施方式
[0021]为更进一步阐述本专利技术为达成预定目的所采取的技术手段及功效,以下结合附图及较佳实施例,对本专利技术进行详细说明如后。
[0022]应理解,用语“包括”、“包括有”、“具有”、“包含”和/或“包含有”,当在本说明书中使用时表示存在所陈述的特征、整体、步骤、操作、元件和/或本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种听觉无感的音频模拟水印加注方法,其特征在于,包括:获取音频文件,并对所述音频文件进行傅里叶变换处理;基于分配的水印频段,在当前的音频文件的对应频段中添加水印;对当前音频文件进行逆傅里叶变换,以获得加注水印后的音频文件。2.根据权利要求1所述的听觉无感的音频模拟水印加注方法,其特征在于,所述基于分配的水印频段,在当前的音频文件的对应频段中添加水印,包括:获取水印内容;基于配置的编码规则,对所述水印内容进行水印编码;在预设的频率区间内,呈逆梅尔刻度分布设置有至少两处锚点频率,即添加水印的频率;基于预设的添加规则,将编码后的所述水印内容添加至所述锚点频率。3.根据权利要求2所述的听觉无感的音频模拟水印加注方法,其特征在于,所述基于配置的编码规则,对所述水印内容进行水印编码,包括:数字编码或数字与汉字相结合编码之中的至少一种。4.根据权利要求2所述的听觉无感的音频模拟水印加注方法,其特征在于,所述预设的频率区间包括:3000Hz到4500Hz。5.根据权利要求4所述的听觉无感的音频模拟水印加注方法,其特征在于,所述在预设的频率区间内,呈逆梅尔刻度分布设置有至少两处锚点频率,即添加水印的频率,包括:在所述预设频率区间内呈逆梅尔刻度分步设置14处锚点频率;其中,第一锚点的频率配置为3000Hz,第二锚点的频率配置为3138Hz,第三锚点的频率配置为3272Hz,第四锚点的频率配置为3402Hz,第五锚点的频率配置为3528Hz,第六锚点的频率配置为3650Hz,第七锚点的频率配置为3768Hz,第八锚点的频率配置为3883Hz,第九锚点的频率配置为3993Hz,第十锚点...

【专利技术属性】
技术研发人员:陈骁汤跃忠田野陈云坤王荔
申请(专利权)人:中国电子科技集团公司第三研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1