A method for providing hierarchical and indexing based watermarks is described. In one embodiment, a watermark tree is formed from the feature watermark, and the feature watermark is generated from a NLP stack with Natural Language Processing (NLP) analysis. The watermark tree represents the hierarchical relation between each feature watermark. Specifically, the watermark tree defines the hierarchical pointer according to the hierarchical relation, and the hierarchical pointer indicates the inherited watermark between the feature watermarks. In addition, the watermark tree includes a timestamp that specifies the time to access the content of the data set that exists in the collection.
【技术实现步骤摘要】
用于表示为树的分级的并基于索引的水印的系统和方法
本专利技术总体地涉及对内容加水印,更具体地涉及表示为树的分级的并且基于索引的水印,其提供可以保护内容不被修改同时关于具体文集状态证实内容源。
技术介绍
传统的水印技术通常提供防止伪造物品的安全机制。可以是可见和不可见的水印通常被放置在源文档上并且可以用于提供原作者和版权保护、真实和防篡改机制。其中已经使用水印的一个领域是可通过因特网访问的数字内容。具体地,水印已经用于控制如何分发或再使用数字内容(例如数字图书馆、在线新闻、杂志、科学期刊、百科全书、个人日志、材料(stores)、广告等等)。自然语言(NL)加水印是已经用于控制如何分发或再使用数字内容的一种类型的水印技术。NL加水印通常设法通过操纵句子的语义和/或语法结构来在文本文档中嵌入信息。NL加水印不同于文本加水印,文本加水印通常修改文本格式的外观或者字体,比如例如修改文本中的字间和字母间的间隔。
技术实现思路
在一个实施例中,存在在计算机系统上进行的用于对存储在多个全集(corpora)中的内容加水印的方法,每个全集具有多个文集(corpuse)。在此实施例中,该方法包括使用该计算机系统来进行以下操作:从所述多个全集的一个内的文集接收内容的数据集;将该数据集应用于包括多个自然语言处理(NLP)分析术的NLP堆栈,该多个NLP分析术每个分析该数据集;从多个NLP分析术(analytics)的每个产生特征水印;以及从每个特征水印形成水印树,水印树表示从多个NLP分析术的每个产生的特征水印的每个之间的分级关系,该水印树根据该分级关系定义分级指针,分级指针指出存 ...
【技术保护点】
一种在计算机系统上进行的用于对存储在多个全集中的内容加水印的方法,每个全集具有多个文集,该方法包括:使用该计算机系统来进行以下操作:从所述多个全集的一个内的文集接收内容的数据集;将该数据集应用于包括多个自然语言处理(NLP)分析术的NLP堆栈,该多个NLP分析术每个分析该数据集;从多个NLP分析术的每个产生特征水印;以及从每个特征水印形成水印树,水印树表示从多个NLP分析术的每个产生的特征水印的每个之间的分级关系,该水印树根据该分级关系定义分级指针,分级指针指出存在于特征水印之间的继承的水印,该水印树包括指定从文集访问该数据集的时间的时间戳。
【技术特征摘要】
2012.07.13 US 13/549,0561.一种在计算机系统上进行的用于对存储在多个全集中的内容加水印的方法,每个全集具有多个文集,该方法包括:使用该计算机系统来进行以下操作:从所述多个全集的一个内的文集接收内容的数据集;将该数据集应用于自然语言处理NLP堆栈,该NLP堆栈包括多个NLP分析术,该多个NLP分析术每个分析该数据集;从多个NLP分析术的每个产生特征水印;以及从每个特征水印形成水印树,水印树表示从多个NLP分析术的每个产生的特征水印的每个之间的分级关系,该水印树根据该分级关系定义分级指针,分级指针指出存在于特征水印之间的继承的水印,该水印树包括指定从文集访问该数据集的时间的时间戳。2.根据权利要求1所述的方法,还包括利用文集时间戳将水印树存储在文集中,以及响应于将水印存储在文集中,将全集时间戳应用于与该文集相关联的全集,该文集包括每个在不同的时间戳处形成的多个水印树,并且该全集包括多个全集时间戳,每个全集时间戳与将多个水印树之一存储在文集中的时间相关联。3.根据权利要求2所述的方法,还包括响应于用新的数据源更新,使用加时间戳的多个水印树来验证文集的内容。4.根据权利要求3所述的方法,还包括证实在具体时间时的文集和全集为多个水印树的函数。5.根据权利要求4所述的方法,其中证实包括从多个水印树中选择具有与在文集和全集的证实中指定的具体时间对应的时间戳的水印树,递归地遍历该水印树中的分级指针以量度在该分级关系中与每个父亲相关联的特征水印是否能够被验证为具有有效的特征水印。6.根据权利要求5所述的方法,还包括将在分级关系中的不具有有效的特征水印的父亲无效,并且将在分级关系中的从属于该被无效的父亲的所有孩子无效。7.根据权利要求6所述的方法,还包括将从被无效的父亲发散的分级关系的子链中的所有特征水印无效。8.根据权利要求7所述的方法,还包括从响应于对文集做出的搜索请求而从文集产生的搜索结果中过滤掉与所有被无效的特征水印相关联的所有内容。9.根据权利要求7所述的方法,还包括重新预处理与在分级关系中具有被无效的特征水印的父亲和孩子相关联的所有数据内容。10.根据权利要求9所述的方法,其中重新预处理包括仅对于在分级关系中具有被无效的特征水印的父亲和孩子产生新的特征水印,而在分级关系中具有被验证的特征水印的父亲和孩子保留当前水印特征。11.根据权利要求10所述的方法,...
【专利技术属性】
技术研发人员:AK鲍曼,RL达登,JJ范,AA卡尔扬珀,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。