当前位置: 首页 > 专利查询>朱烽专利>正文

利用文字形体特征携带水印信息的文本数字水印技术制造技术

技术编号:4161194 阅读:216 留言:0更新日期:2012-04-11 18:40
一种利用文字形体特征携带水印信息的文本数字水印技术。本发明专利技术要解决的技术问题是:在不太影响阅读习惯的前提下,把被保护的内容和防盗版的内容紧密联系在一起,使到盗版者很难在电子出版物的图像上把两者分割,保存电子出版物中的编码信息,从而识别泄露电子出版物的用户,达到阻止盗版泛滥。具体是通过利用汉字的几种形体来代表1和0,把可以识别用户的序列号用形体的变化编码到文章随机位置。

Text digital watermarking technique for carrying watermark information using text shape features

A text digital watermarking technique that uses text feature to carry watermark information. The invention solves the technical problems is: do not affect the reading habits of the premise, put together the protected content and anti-theft version of the content, so it is difficult to both in image segmentation of electronic publications on the pirate encoding information stored in electronic publication, so as to identify the electronic publications the user, to prevent piracy. Specifically, by using several characters of Chinese characters to represent 1 and 0, the serial number of the identified user can be encoded into the random position of the article by the change of the form.

【技术实现步骤摘要】

本专利技术属于通信与信息工程领域,具体涉及数据的编码与加码、数字水印 技术,聚焦于解决国内网络小说VIP章节反盗版的技术问题
技术介绍
随着网络生活的普及,电子出版的商业模式得到商家和用户的青睐,特别 是以起点为代表的国内小说网站的兴起,读者可以通过网络用低廉的价格订阅 小说中的单篇(即VIP章节),不用整本地购买,而作者可以通过网络写作获得 ,小说网站可以获得分成,这是一个三赢的商业模式。不过一些小网站,利用已经注册的VIP帐号,看完了 VIP章节之后把截图下来,放到自己网站去,获得流量卖广告获得收益。这种做法等于寄生在以起 点为代表的正规大型小说网站,助长了盗版风气,严重影响正规大型小说网站 的营运。传统的数字水印技术和理论面对这些一种现实的盗版行为,保护力度显得 苍白无力。大体有两大类的保护方法 一是把要保护的小说文章制作成图片,利用图 像数字水印技术,如底纹加密和在图像内添加隐藏信息,二是在被保护文章被 制作成图片前利用文本水印技术。代表文章二值文本数字水印技术的研究与 仿真(系统仿真学报,作者王惠琴,李人厚)和基于文本内容的数字水印 算法的设计与实现(计算机工程与设计,作者舒后,杨潮,何薇,杜娟)。 现在网络小说网站基本上是综合这两大类保护办法来实现反盗版技术。通过分析之前网络小说VIP章节的防盗版技术以及相关的数字水印技术, 发现被保护的内容和防盗版的内容之间是分开的,即去除了防盗版的内容, 剩下的就是被保护的内容。只要在网络小说VIP章节的图像上找到两种内容的 区分条件,去除掉防盗版的内容,盗版者可以和正版用户一样阅读作品。被保护的内容和防盗版的内容之间的分开具体体现为两个方面 第一个方面比较直观,就是被保护的内容图像和防盗版的编码内容图像是 分开的。比如在VIP章节图像中添加可视的编码底纹,或者添加肉眼识别不出 的色彩编码组合点等。因为保护内容——文档文字比较简单,文档文字与背景 两者的图像颜色可以认为是二值图像,防盗版的编码内容图像颜色实质是第三 值,它可以接近或等于背景颜色,但绝对不能,或者不能大面积接近和等于文 档文字颜色,不然文档会变成不可读,那么因为文档文字颜色与编码内容图像 颜色之间存在距离,所以就存在分开两者的技术手段;第二个方面比较抽象点,就是被保护的内容图像的阅读和防盗版的编码内 容图像的阅读是分开的。把读者阅读小说抽象成一个简单模型看到文字的形 一〉识别文字意思,读者阅读小说简单说就是重复前面那个模型,并把识别的 文字意思连贯起来形成想象。前面说的被保护的内容图像的阅读就是看到文 字的形一〉识别文字意思这个模型。传统数字水印技术中有一些是利用段落间 距、字间距、文字的拓扑结构或者空格等一些与前面模型无关文档元素来编码, 简单抽象防盗版的编码内容图像的阅读模型是看到非文字的形的显示图像》 识别编码信息。因为两个模型存在距离,那么也就存在分开两者的技术手 段。除了上面两大类保护办法外,还有一些小手段,如起点最近采用了在不重 要段落、不显眼段落添加有意义的字句,这个大概上可以归入第二类保护办法,不过这个办法很容易被察觉,不是长久的办法。另外还有是基于内容的文本数 字水印技术,不过还没有成熟的基于内容嵌入数字水印的解决方案,只有一些 简化方案,如利用汉字的同义字或者同音字,但存在携带信息小和容易被识破 的缺点。
技术实现思路
本专利技术要解决的技术问题是在不太影响阅读习惯的前提下,保存网络小 说VIP章节中的编码信息,当被保护的网络小说VIP章节被截图后非法分享时, 能够从盗版图片中读出编码信息,从而识别泄露电子出版物的用户,达到阻止 盗版泛滥。针对以前技术的不足,本专利技术提出一个解决方案,在不太影响阅读习惯的 前提下,把被保护的内容和防盗版的内容紧密联系在一起,使到盗版者很难在 在网络小说VIP章节的图像上把两者分割。这个解决方案即为利用文字形体特 征携带水印信息的文本数字水印技术。因为本专利技术是聚焦于解决网络小说VIP章节反盗版,特别是国内的技术问 题,加上本专利技术涉及文字形体,所以下面根据汉字的特性来设计和说明解决方 案。基本原理是通过适当地选择文字的几种形体,并对文字的形体特征进行编 码,利用文字的形体变化来携带数字水印信息。 汉字的形体包括字体和字形两个方面。汉字的形体变化十分丰富。同一个汉字可以书写成隶、楷、行、草等不同 字体,同一种字形有印刷体与手写体之分印刷体有不同字号,手写体风格又因 人而异。另外,虽然汉字是方块字,但印刷和书写中又有长体、扁体、斜体等不同风格。可见,汉字的形体具有一定的自由度。汉字的形体是汉字的一个方面,具体说是汉字的显示方面,而小说中的文 字(汉字)所要传达给读者是汉字的意思方面,读者阅读过程简单说就是通过 看到汉字的显示,接受到汉字的意思,连续起来,从而形成整体意思。把汉字显示的不同方式赋予特定意思,若干个汉字的显示方式组合可以代 表一个对应用户帐户的序列号,这样就把序列号用汉字的形体变化编码进了文 章内,再把文章变成图片形式,那么被保护的内容图像和防盗版的编码内容图 像是一样的,都是汉字的显示方式;而且被保护的内容图像的阅读和防盗版的 编码内容图像的阅读也是一样,两者阅读的对象都是汉字的显示方面,不同的 是前者从汉字的显示方面获得该汉字的意思,后者是从汉字的显示方式组合获 得编码信息。盗版者在没有图像识别出文章文字前,没法消除掉汉字的形体变化,也等 于无法去掉编码,那么就意味着盗版者在散布出文章图像的时候,也将暴露出 自己的用户帐户。文字形体编码形成的文章图像自身对OCR (文字图像识别技术)有一定的干 扰性,附图的图1是用TORD自带的字体库来文字形体编码,用Office自带的 工具Doc咖ent Imaging程序OCR识别文字正确率不到70%。至于影响阅读的程度问题,可以从附图的图1 (示范文档)很直观地看到, 用文字形体编码后的文章在阅读性方面没有太大影响,这有赖于汉字是平面文 字,汉字由一个或以上的字根以二维方式(欧语系是一维文字)在特定的空间、 配置在一个正方块内而组成。汉字产生的这种视象重在让读者去做图像感受, 这样培养了使用汉字的人群具备较强的形象感受能力。所以在文章中,汉字形体的变化对于使用汉字的人群来说,并不太影响阅读。与类似的技术方案做比较。基于字符拓扑结构的文本数字水印技术,(小型微型计算机系统,作者 和专利技术人刘东)已申请专利,专利号200410040853. 4。(利用字符的字形 特征携带水印信息的文本数字水印技术)虽然上述专利,作者使用了 字形这个名词,但是他实质的意思是指字 符的拓扑结构,在他后期的论文中(即基于字符拓扑结构的文本数字水印技 术)就用字符拓扑结构代替字形。而且在专利的权利要求文中的权利要求l提到一种要与携带数字水印信 息的将同以字符(串)设计成多种字形的方法,其特征是通过改变组成字符 (串)的各笔划之间的连断关系来改变字符(串)的拓扑结构,从而得到语义 上相同的同一字符(串)的多种字符(串)外形。;和在专利的说明文中提到本专利技术的基本原理在于变组成字符(串)的各 笔划之间的连断关系,设计出语义上相同的同一字符(串)的多种字符(串) 外形、、、。两处都可以看出,专利人的专利技术是基于字符拓扑结构的本文档来自技高网
...

【技术保护点】
一种通过文字的形体编码来携带数字水印信息的方法,其特征是:通过适当地选择文字的几种形体,并对文字的形体特征进行编码,利用文字的形体变化来携带数字水印信息。

【技术特征摘要】
1、一种通过文字的形体编码来携带数字水印信息的方法,其特征是通过适当地选择文字...

【专利技术属性】
技术研发人员:朱烽
申请(专利权)人:朱烽
类型:发明
国别省市:44[中国|广东]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1