一种基于音频内容分类的水印嵌入及检测方法技术

技术编号:11596811 阅读:260 留言:0更新日期:2015-06-12 07:15
本发明专利技术提供了一种基于音频内容分类的水印嵌入方法,其步骤如下:步骤一,将来自音频广播系统制作室输出的AES/EBU格式或者模拟音频左右声道格式的广播音频节目源音频信号进行分段;步骤二,对某一段音频信号进行自适应能量检测,如该段音频信号经检测为静音信号,则不进行水印信号的嵌入,否则转入步骤三;步骤三,将音频信号段进行音频特征分析,并基于内容进行分类,包括语音、音乐两类;步骤四,根据该音频信号段所属类别,首先在音频段前半部嵌入音频类别码,然后分别采用不同的水印嵌入算法进行嵌入。本发明专利技术在对音频进行分类的基础上,有针对性地选择适应音频所属分类的水印嵌入算法,有效发挥单一算法的优势,提高水印的各项性能。

【技术实现步骤摘要】

本专利技术属于通信
,涉及一种基于音频内容分类的水印嵌入及检测方法
技术介绍
数字水印(Digital Watermarking)技术是将一些标识信息(即数字水印)直接嵌入数字载体(包括多媒体、文档、软件等)当中,但不影响原载体的使用价值,也不容易被人的知觉系统(如视觉或听觉系统)觉察或注意到。通过这些隐藏在载体中的信息,可以达到确认内容创建者、购买者、传送隐秘信息或者判断载体是否被篡改等目的。数字水印是信息隐藏技术的一个重要研究方向。近年来,被广泛地应用到网络音视频领域,主要用于数字媒体产品的知识产权保护和防伪。数字音频水印技术是指将待嵌入的隐藏标记例如:节目标识和用户识别号等,以数字信号处理的方法加载到音频数据中,这种标记通常是不可见、不可感知的,只有通过专用的水印检测器才能够提取。从而可以保证音频作品的版权。音频广播系统所传输的节目流包括各种类型的声音信号,且信号变化很大。而数字音频水印嵌入算法对不同类型的音频信号表现出不同的特性。因此,如何提取音频节目流中的音频特征信息,是解决这一问题的关键。音频的自动分类,如针对语音和音乐的分类,作为提取音频信号特征的重要手段之一,日益引起人们的重视。传统的音频广播系统在电台端首先由制作室制作播出音频节目,经过SDH环网(Synchronous Digital Hierarchy,同步数字体系)或光传输网,传输至发射台调制器端,调制并发射模拟音频广播信号。上述步骤主要完成节目的制作,节目的传输和节目的播出。具体步骤为:由总控室制作的节目如实时性的新闻类节目、访谈类节目及非实时性的广告类播放节目和音乐类节目,这些音频节目以PCM样点的形式输出给音频处理器进行音频预处理,然后进行编码、复用输出TS流,将该TS流经过SDH环网或光网传输到发射台,在发射台中经过解码、解复用输出模拟音频并调制发射模拟音频广播信号。随着文化生活的日益丰富,广播节目内容的制作量也逐渐增加。同时,针对广播节目的盗版情况也大幅增加。因此,如何保证广播节目制作方的版权利益、有效防范盗版情况的发生,日益成为一个被广播节目制作方所关注的关键问题。
技术实现思路
本专利技术要解决的技术问题是,提供一种针对性强、提高水印各项性能的基于音频内容分类的水印嵌入及检测方法。本专利技术采用的技术方案是:一种基于音频内容分类的水印嵌入方法,其步骤如下:步骤一,将来自音频广播系统制作室输出的AES/EBU(Audio Engineering Society/European Broadcast Union,即音频工程师协会/欧洲广播联盟)格式或者模拟音频左右声道格式的广播音频节目源音频信号进行分段;步骤二,对某一段音频信号进行自适应能量检测,如该段音频信号经检测为静音信号,则不进行水印信号的嵌入,否则转入步骤三;步骤三,将音频信号段进行音频特征分析,并基于内容进行分类,包括语音、音乐两类;步骤四,根据该音频信号段所属类别,首先在音频段前半部嵌入音频类别码,然后分别采用不同的水印嵌入算法进行嵌入。进一步,步骤一的音频分段是将音频广播系统制作室输出的音频节目源分割为指定长度数目的采样点的音频子段,两个相邻子段间有50%的重叠部分。进一步,步骤二的自适应能量检测是利用语音和噪音在能量上的这种差别进行检测,该算法通过比较输入信号的能量与语音能量阀值的大小,来判断输入的信号是否为语音,输入信号每帧的能量可由下面的公式得出:                  (公式1)表示第 j 帧的能量, x (i)为输入的信号,N为帧长,其具体包括:A1,计算初始化阀值,初始化的阀值是由静默时期的信号能量计算得出,一般做法是认为通话开始前200ms是没有语音的,所以初始化的阀值是由前8192点的数据计算得出,如公式(2)所示:                               (公式2)为初始化的阀值所以当 > k时表示第j帧为语音,反之表示为噪音,其中k为一常数,一般k为2;A2,判断第一帧阀值是否为静音,若公式2中 Er < 0.0003,则被认为该帧为静音帧;A3,如果音频已停止,结束;否则,按照公式2,计算当前帧的功率;A4,计算阀值比,如下式,A5,计算阀值抖动参量;因为背景噪声是非平稳的,所以阀值也要根据噪声能量进行自适应的改变,变化方法见式:为新的阀值为旧的阀值为背景噪声能量而p为加权值,(0<p<1)一般取0.2,即如下式计算阀值抖动参量,E_new= 0.8*E_old+0.2*a;A6,对该帧进行自适应能量判断,在原来算法里的判决规则是当> k,而 k 为一常数,一般 k 为 2,但是由于一般音频节目流中信噪比是在不断变化的,所以 k 值也应该随着信噪比的变化而变化,而信噪比可由下式得出:其中,为语音帧的能量,为静音判决的阀值,而 k 值的更新式由下式得出:其中为遗忘因子,一般取值0.2。进一步,步骤三中的音频段分类时,音频节目信号首先通过预处理操作,然后进入分类器,通过基于内容的分类,将音频段分为语音或音乐;其具体包括: B1,选取相关特征对广播节目音频流音频信号进行特征分析并提取;B2,利用初级分类器得到初步分类的结果;B3,利用音频类别的前后相关性,使用上下文分类器修正初始分类得到最终分类的结果。进一步,步骤四中的语音类音频段选择基于心理声学模型I的扩频水印嵌入算法,音乐类音频段选择基于心理声学模型II的扩频水印嵌入算法。一种基于音频内容分类的水印检测方法,其步骤如下:步骤一,读取音频节目流,并按照固定长度进行分段;步骤二,对该段音频信号进行自适应能量检测,若该段音频信号经检测为静音信号,则不进行水印信号的检测,否则转入步骤三;步骤三,对该音频段前半部进行检测,判断该音频段所属音频类别;步骤四,根据步骤三给出的音频类别,将音频段输入到不同水印检测算法中,进行水印检测,并输出结果。本专利技术可以在对音频进行分类的基础上,有针对性地选择适应音频所属分类的水印嵌入算法,克服单一水印嵌入算法的不足,有效发挥单一算法针对某类音频的优势,从而提高水印的各项性能。附图说明图1为本专利技术的水印嵌入算法框图。图2为本专利技术的水印检测算法框图。图3为本专利技术的自适应能量检测流程图。图4为本专利技术的基于内容的音频分类系统架构图。图5为本专利技术的分类器内部框图。图6为本专利技术实施例中的水印检测算法框图。具体实施方式下面结合具体实施例来对本专利技术进行进一步说明,但并不将本专利技术局限于这些具体实施方式。本领域技术人员应该认识到,本专利技术涵盖了权利要求书范围内所可能包括的所有备选方案、改进方案和等效方案。一种基于音频内容分类的水印嵌入方法,如图1所示,其步骤如下:步骤一本文档来自技高网
...

【技术保护点】
一种基于音频内容分类的水印嵌入方法,其步骤如下:步骤一,将来自音频广播系统制作室输出的AES/EBU格式或者模拟音频左右声道格式的广播音频节目源音频信号进行分段;步骤二,对某一段音频信号进行自适应能量检测,如该段音频信号经检测为静音信号,则不进行水印信号的嵌入,否则转入步骤三;步骤三,将音频信号段进行音频特征分析,并基于内容进行分类,包括语音、音乐两类;步骤四,根据该音频信号段所属类别,首先在音频段前半部嵌入音频类别码,然后分别采用不同的水印嵌入算法进行嵌入。

【技术特征摘要】
1.一种基于音频内容分类的水印嵌入方法,其步骤如下:
步骤一,将来自音频广播系统制作室输出的AES/EBU格式或者模拟音频左右声道格式的广播音频节目源音频信号进行分段;
步骤二,对某一段音频信号进行自适应能量检测,如该段音频信号经检测为静音信号,则不进行水印信号的嵌入,否则转入步骤三;
步骤三,将音频信号段进行音频特征分析,并基于内容进行分类,包括语音、音乐两类;
步骤四,根据该音频信号段所属类别,首先在音频段前半部嵌入音频类别码,然后分别采用不同的水印嵌入算法进行嵌入。
2.根据权1所述的一种基于音频内容分类的水印嵌入方法,其特征在于:步骤一的音频分段是将音频广播系统制作室输出的音频节目源分割为指定长度数目的采样点的音频子段,两个相邻子段间有50%的重叠部分。
3.根据权1所述的一种基于音频内容分类的水印嵌入方法,其特征在于:步骤二的自适应能量检测是利用语音和噪音在能量上的这种差别进行检测,该算法通过比较输入信号的能量与语音能量阀值的大小,来判断输入的信号是否为语音,输入信号每帧的能量可由下面的公式得出:
                               (公式1)
表示第 j 帧的能量, x (i)为输入的信号,N为帧长,其具体包括:
A1,计算初始化阀值,初始化的阀值是由静默时期的信号能量计算得出,一般做法是认为通话开始前200ms是没有语音的,所以初始化的阀值是由前8192点的数据计算得出,如公式(2)所示:
                               (公式2)
为初始化的阀值所以当 > k时表示第j帧为语音,反之表示为噪音,其中k为一常数,一般k为2;
A2,判断第一帧阀值是否为静音,若公式2中 Er < 0.0003,则被认为该帧为静音帧;
A3,如果音频已停止,结束;否则,按照公式2,计算当前帧的功率;
A4,计算阀值比,...

【专利技术属性】
技术研发人员:黄寅王晓光程伟吴小茜
申请(专利权)人:浙江省广电科技股份有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1