一种在无序抽象数据中嵌入数字水印的方法技术

技术编号:2868600 阅读:200 留言:0更新日期:2012-04-11 18:40
专门用于无序抽象数据集的数字水印技术。其中心思想为对数据进行分类然后逐类修改统计特征来嵌入水印。其具体步骤为:    1)将数据划分为重要的、不可调整的部分和可以微调的部分。    2)对数据重要的部分进行一个带密钥的变换,通过变换结果对数据分类。    3)根据要嵌入的水印消息,修改每一类数据的可微调部分的奇偶分布。    4)提取水印时,按照相同的方法对数据进行分类,统计每一类中可微调部分的奇偶分布。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及数字水印领域,具体的说,本专利技术提出一种数字水印技术来保护科学数据的版权。数字水印技术可以在数字产品中嵌入版权信息来作为产品所有权的证据。科学数据是经过科学实验,统计后得到的离散数据,例如某地区一年的气温纪录、某天体的观测记录、某客户群的市场行为统计、地理数据等等。
技术介绍
作为信息隐藏技术的一个分支,数字水印技术在近年来得到越来越广泛的应用。然而目前数字水印的应用领域大多局限在数字多媒体中,如数字图像、数字音频、数字视频。数字多媒体的特点是1.数据在时间或空间上有固定的顺序。即,多媒体数据通常包括两个平面,一个是数据平面,另外一个是顺序平面。2.数据的接收者是人类的感官。传统的水印技术大多利用了上述两个特点,即1.水印嵌入于数据平面,利用顺序平面来保持水印提取的同步。2.水印嵌入和攻击的强度均以不可被人类的感官察觉为界限。而科学数据从抽象的层次来对待一切数据,不再局限于多媒体,所以不再具有多媒体数据特有的优势1.数据是抽象的,统一的,无序的。如地理坐标数据虽然地理坐标提供了空间上的位置信息,但该信息本身被视为数据,并将被嵌入水印。不存在额外的顺序平面。2.数据的接收者是抽象的数学模型。数据在这里被提取、分析。水印嵌入和攻击的强度均以不破坏数据的科学价值为界限。所以传统的水印技术一般不能应用于科学数据的版权保护中。
技术实现思路
1.数据格式我们的水印技术可以通用于如下形式的数据。离散数据集S由大量的数据组构成。每一组数据都是一个n维向量(X0,X1,...,Xn-1)(比如横坐标、纵坐标、运动方向、速率构成一个4维向量)。所有组对应位置的Xi(0≤i≤n-1)都有着相同的物理意义和测量精度。下面的叙述中我们用(X0,X1,...,Xn-1)、Xi代表变量,用(x0,x1,...,xn-1)、xi代表具体的实例,|S|代表集合S包含元素的总数。2.失真度量水印的嵌入和攻击都必须在适当的失真范围之内,否则会影响数据的科学价值。科学数据对失真的要求有其自身的特点 1)数据有精度要求,比如精确到小数点后第几位。2)相对数量而言,更加重视质量——对数据的正确性要求严格,但是对数据量增加或删除的限制相对放松。比如一组植物生长测量数据,如果测量数据有较大失误,那么数据的科学价值就降低了。相对而言,增加或减少几个测试对象并不会影响数据的整体价值。在一个n维向量(X0,X1,...,Xn-1)中,可能各个Xi的物理意义、精度要求不尽相同,所以我们需要逐个考虑失真度。我们采用下面的均方误差来度量|S|个X1被修改为 后的失真度MSEi=1|S|Σ|S|(X~i-Xi)2---(1)]]>水印的嵌入和攻击都必须满足MSEi≤τi(2)其中τi是常量,与Xi对精度的要求有关。我们设定τi=10-2ki2,]]>ki为X1精确到小数点后的位数。除了对数据修改引进的失真度量外,对于数据的增删,我们规定增删的数据量|S′|和原数据量|S|应该满足|S′|≤|S|2---(3)]]>3.算法描述算法的中心思想是对数据分类然后修改数据的统计特征。定义一。给定数据Data,定义核Ker(Data)为Data舍弃了最高精度位剩下的部分。定义二。给定数据Data,定义非核Ker(Data)为Data非数据核的部分。定义三。数据集S的核Ker(S)={Ker(X)|X∈S)。例如,数据Data为二维向量(1.141,2.015)且精确到1/1000,那么Ker(Data)=(1.14,2.01),Ker(Data)=(0.001,0.005)。数据核是数据可信度的保证,也是数据科学价值的依附点。我们的算法将基于数据核分类。数据的非核是可以微调的部分,我们的算法添加水印于数据非核中。3.1.分类方法给定数据Data、对称加密算法E、密钥K和映射fEK(Ker(Data))→ZN,数据Data被分成N类。具体的计算方法为 f(EK(Ker(Data))) (4)数据核保证了分类结果不会受到数据微小变动的影响,对称加密算法保护了分类结果不被公开并能防止对数据直接进行统计分析。例如,数据Data为二维向量(1.141,2.015),如果精确到1/1000,那么Ker(Data)=(1.14,2.01)。假设加密后结果为123456,N=10。定义f为模10运算有123456 mod 10=6,数据最终被分到第6类。均匀假设。数据集S的核Ker(S)满足|Ker(S)|足够大,那么按照(4)的方法得到的分类是比较均匀的(即,从0到N-1类,每一类的数据量大致相当,且不存在数据量过小的类)。我们在这里对数据量最小的类做如下估算假设划分S为N类后,某个类对应的子集为s,那么在随机映射foEK的假设下Pr=|Ker(S)|k(1N)k(1-1N)|Ker(S)|-k---(5)]]>这是一个二项式分布,其期望为 方差为 根据Chebyshev公式有Pr≤Pr≤(N-1)×|Ker(S)|N2|Ker(S)|24N2=N-14|Ker(S)|<N4|Ker(S)|---(6)]]>根据Chernoff公式有Pr<(e-12(12)12)|Ker(S)|N=exp((ln2-1)|Ker(S)|2N)---(7)]]>结合(6),(7)有Pr<min(N4|Ker(S)|,exp((ln2-1)|Ker(S)|2N))---(8)]]>根据(8)计算的结果列表如下 假设事件Ei(0≤i≤N)代表第i个子集的数据量小于 的概率,Ei之间并不独立,但是我们可以估算一下N个子集中至少有一个子集数据量小于 的概率Pr≤Pr+Pr+···+Pr=Nmin(N4|Ker(S)|,exp((ln2-1)|Ker(S)|2N))---(9)]]>假设S是2维向量(X1,X2)的集合,N=128。如果|Ker(S)|=10000,那么由(9)可知,划分S后至少存在一个子集数据量小于|Ker(S)|/2N=39的概率不超过0.08%。所以我们的分类方法对于至少99.9%的S都可以保证划分后每一个子集的数据量都大于39。上面的推导表明均匀假设是合理的。说明。为了保证均匀假设的正确性,欲添加水印的科学数据集必须满足|Ker(S)|足够大。3.2.水印嵌入算法数据为大量n维向量(X0,X1,...,Xn-1)组成的无序集合,按照(4)均匀分成N类。我们的算法在每一类中嵌入n比特。假设某个向量(x0,x1,...,xn-1)被划分到的类中需要嵌入比特串b0b1...bn-1,那么修改xi(0≤i≤n-1)的非核,使其具有和bi相同的奇偶性。对于所有向量、所有xi均经过上述的调整后,我们成功嵌入了N×n比特的水印数据。我们给出伪代码描述如下输入。数据集S={(X0,X1,...,Xn-1))水印比特矩阵WN&tim本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:杨义先汪涛钮心忻
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利