在文档中嵌入信息及检测和防止抽取嵌入信息的方法和系统技术方案

技术编号:2886645 阅读:199 留言:0更新日期:2012-04-11 18:40
为了提供一个在包含以页描述语言写的文本的文档数据中嵌入信息的方法和系统。首先,分析信息将被嵌入的文档数据的编排格式,接着,根据对编排格式的分析,生成信息将被嵌入的位置的一个序列。根据嵌入信息,修改该文本的确定位置的页描述。结果,信息被嵌入包含以页描述语言写和文本的文档数据中。该位置序列通过产生一个顺序的伪随机数字串来生成。(*该技术在2019年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种在一个电子文档中嵌入包括文本数据的附加信号,即所谓的电子水印信息的方法,一种防止这些嵌入信息被破坏的方法,一种防止重利用这些嵌入信息的方法,及其系统。由于大量的信息可以通过互联网或通过使用CD-ROM进行发行,为进行电子搜索和包含数字数据的文档的发行提供服务的商务变得很重要。为了确保这种商务的安全发展,能够提供包含在将要发行的数据文档中的有版权资料的管理并保护所有者权利的技术是不可缺少的。那些希望保护包含在数字文档中的秘密资料和希望寻找并跟踪泄露秘密的路径的公司也需要这种技术。用于管理有版权的电子数据的技术可大致分为两种方法即采用加密和授权的访问控制和电子水印。第一种技术是确保访问所选数字资料的内容仅限于那些已购买权利的用户或那些对资料的使用由管理者控制的用户。后一种技术提供一种功能可防止或跟踪数字文档包含的解码数据的二次外流。为了给有版权材料提供严格的管理必须将这两种技术结合起来。在各种各样的媒体中,对大量发行的文本数据使用电子水印技术有很大的需求。但是,在纯文本数据中只有很少的冗余用于信息表达,嵌入补充原始内容(即电子水印信息)的信息非常困难。在题目为“PostScript和PDF文档的数字水印建议”,Ryujiro Shibuya,Yuichi kaji和Tadao kasa,SCIS98-9.2.E(现有技术1)中,日本未审查专利公开编号Hei 7-222000(现有技术2)和日本未审查专利出版物编号Hei 6-324625(现有技术3)中,提出一种将水印信息嵌入到文档描述中以包含外观和编排格式的技术,其要点是基于这样一个事实,即页描述形式,如PS(PostScript)或PDF(可携带文档格式),往往被用于文本数据的实际发行。在上述现有技术中,对行间距、字间距和字体进行轻微修改以便在文档中嵌入信息。但是,当不满足下面两个条件时,使用上述常规技术管理版权或指定泄密路径是很困难的1检测包含在多个文档的数据中的水印只能由拥有公共检测钥的用户来完成。2该技术足够健壮使得在一般发行处理过程中,它可以避免格式转换及由未授权用户对材料的破坏。但是,现有技术1没有指出可以满足条件1的特定检测方法。方法1和方法2中描述的方法除了处理字符行的基行的方法,要求与原始文档数据进行对比。由于要为嵌入水印的每个文档记录和管理水印检测信息,在一个大的系统中该方法难于使用。上述方法没有一个支持使用一个钥的检测系统(只有钥拥有者允许检测一个水印的系统)。至于条件2,只在现有技术2中写有对打印数据的重扫描的研究,而没有考虑使页描述数据足够健壮以避免其自身的破坏。实际上,很多页描述格式是对公众开放的,可能被破坏。例如,由基行处理嵌入在一个行间隔中的一个水印可以通过轻微调整各个行的位置和维持一个不变的宽度被轻易破坏。另外,只有未嵌入水印信息的纯文本数据可以被从页描述数据中抽出并被使用。在日本未审查专利公布No.Hei 8-348426(现有技术4)中,提出一种使用两个位置序列的统计属性来嵌入水印的方法。尽管现有技术4中描述的该技术不是涉及文本的电子水印的专利技术,该技术满足条件1,至于条件2,当位置随机变化时,它能够进行足够健壮的嵌入。但是,在页描述中采用这种技术很困难。如果这种技术用于页描述,用于指定位置序列的方法并不明显,它不同于在一个图象中插入一个水印。在嵌入一个水印时,需要调整位置的对象必须被唯一标识。页描述由一组包括位置信息的页描述对象(字符或字符串)组成,但不包括标识和排序各个元素的信息。虽然对于一个图象,象素和小区域可以由X和Y座标指定,在页描述中一旦一个文档或一页被改变,在由座标指定的特定区域内其位置可以被调整的对象不是总能出现。因为在页描述中对象在页图象中的位置顺序不影响图象外观,对象在文件格式中出现的顺序在指定对象时没有帮助。实际上,作为文件格式转换或由第三方试图破坏它们(一次攻击)的结果,对象出现在文件中的顺序可能被改变。而且,上述现有技术的例子没有一个提供解决只从页描述数据中抽取纯文本数据的问题的解决方案。由于用于通过网络发行的页描述的说明书对公众开放,只需形成一个可以机械地抽出纯文本数据的适当的程序。另外,页描述的显示软件频繁地支持用剪切和粘贴将数据发送给另一个程序。在这种情况下,一个普通用户可以抽出文本。PDF显示软件用一个保密字控制访问权限并禁止使用剪切和粘贴。但是在当前系统中,如果允许打印,要取消保护只需作一个PDF→PS→PDS转换(在转换为PS时管理保密字的信息被忽略)。因此,一些应用程序可以从页描述数据中抽取出文本并非法买卖。因此,本专利技术的一个目的是提供一种在包含以页描述语言写的文本的文档数据中嵌入信息的方法和系统。本专利技术的另一个目的是提供一种检测在包含以页描述语言写的文本的文档数据中嵌入信息的方法和系统。本专利技术的另一个目的是提供一种在包含以页描述语言写的文本的文档数据中嵌入一个电子水印,并使用公共检测钥检测多文档中的电子水印的方法及其系统。本专利技术的另一个目的是提供一种在文档数据中嵌入信息的方法及其系统,该方法足够健壮能够在普通数据发行处理和非授权用户攻击时防止格式转换。本专利技术的另一个目的是提供一种在文档数据中嵌入信息的方法及其系统,其中其特征需要操作的对象可能被唯一标识。本专利技术的另一个目的是提供一种防止从页描述数据中抽取文本的方法和系统。本专利技术的另一个目的是提供一种在文档数据中作为一个水印嵌入,表示版权的信息的方法和系统。本专利技术的另一个目的是提供一种在文档数据中嵌入信息和防止通过机械处理从文档中删除电子水印的方法和系统。要实现上述目的,首先,对要嵌入信息的文档数据的编排模式进行分析。接着,根据对该编排格式的分析,生成一个要嵌入信息的位置的序列。根据嵌入的信息,改变指定位置的文本的页描述。结果,信息被嵌入包含以页描述语言写的文本的文档数据中。该位置序列是通过产生一个顺序的伪随机数的串来生成的。当,例如,采用一个统计的方法(现有技术4)在页描述语言(如PDF)中嵌入电子水印时,根据文档的编排结构指定两个位置序列。使用该编排格式描述,能够提供描述数据,通过该数据一对指定位置可以证明多个文档的强烈相关,其中每个文档有不同的编排格式,并且提高了嵌入处理的可靠性。要检测嵌在文档数据中的信息,首先分析嵌入信息的文档数据的编排格式。接着,根据分析的编排格式生成嵌入信息的位置的序列。嵌入信息从一个页描述获得,该页描述为在确定位置的文本输入。该位置序列是通过采用用于嵌入信息的顺序的伪随机数的串来生成的。为了在文档数据中嵌入不可变信息,首先从文本中抽取一个信息将被嵌入其中的字符串。然后,抽取出的字符串被分成较小的单元。表示距离该字符串的一个参考点的相对距离或距离前一个字符的相对距离的页描述根据将嵌入的信息而被改变。这里,当原始字符串被分开时,意味着或者被抽出了单独字符或者形成了较小字符串。根据在文档数据中嵌入不可变信息的另一个方面,首先,分析嵌入信息的文档中的数据的编排格式。接着,从分析过的编排格式中选择一个或多个字符。生成一个表示选中字符的字体,该页面描述被改变以便用该字体替换选中的字符。在这些方法中,当页描述语言中的一个对象被机械地重定位时,页描述数据被如此构造使得对象外观发本文档来自技高网...

【技术保护点】
一个信息嵌入系统,用于在包含以页描述语言写的文本的文档数据中嵌入信息,包括: (1)分析要嵌入信息的所述文档数据的编排格式的装置; (2)根据所述编排格式的分析,生成所述信息将被嵌入的位置的一个序列的装置; (3)根据所述嵌入信息在指定位置改变所述文本的页描述的装置。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:平山唯树天野富夫清水周一森本典繁
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利