一种用于识别文字作品异同的方法与设备技术

技术编号:19178445 阅读:38 留言:0更新日期:2018-10-17 00:34
本申请的目的是提供一种用于识别文字作品异同的方法与设备,包括获取第一文字作品与第二文字作品对应的第一作品单元组,其中,所述第一作品单元组包括两个分别从所述第一文字作品、所述第二文字作品中对应部分提取的作品单元;根据所述第一作品单元组中两个作品单元分别生成所述第一作品单元组对应的两个数字指纹信息;根据所述第一作品单元组对应的两个数字指纹信息的异同,确定所述第一文字作品与所述第二文字作品是否相同。与现有技术相比,本方案可更加快速、准确识别文字作品的异同,提高了数字作品版权管理的便捷性。

A method and device for identifying similarities and differences in text works

The purpose of this application is to provide a method and apparatus for identifying the similarities and differences of a written work, including obtaining a first work unit group corresponding to a first word work and a second word work, wherein the first work unit group comprises two corresponding parts extracted from the first word work and the second word work respectively. A work unit; two work units in the first work unit group generate two digital fingerprint information corresponding to the first work unit group; and determine whether the first work is the same as the second work according to the similarities and differences of the two digital fingerprint information corresponding to the first work unit group. Compared with the existing technology, the scheme can identify the similarities and differences of literal works more quickly and accurately, and improve the convenience of copyright management of digital works.

【技术实现步骤摘要】
一种用于识别文字作品异同的方法与设备
本申请涉及通信领域,尤其涉及一种用于识别文字作品异同的技术。
技术介绍
随着时代的发展,互联网的盛行使得数字作品越来越多,数字版权的保护也越来越受到关注。通常情况识别两部文字作品是否为同一作品,将文字作品处理生成整部作品的数字指纹,通过在数据库中查询、匹配来进行文字作品的版权检测,该方法计算量大,操作繁琐,为数字作品的版权保护带来诸多不便。
技术实现思路
本申请的一个目的是提供一种用于识别文字作品异同的方法与设备。根据本申请的一个方面,提供了一种用于识别文字作品异同的方法,该方法包括:获取第一文字作品与第二文字作品对应的第一作品单元组,其中,所述第一作品单元组包括两个分别从所述第一文字作品、所述第二文字作品中对应部分提取的作品单元;根据所述第一作品单元组中两个作品单元分别生成所述第一作品单元组对应的两个数字指纹信息;根据所述第一作品单元组对应的两个数字指纹信息的异同,确定所述第一文字作品与所述第二文字作品是否相同。根据本申请的另一个方面,提供了一种用于识别文字作品异同的方法,该方法包括:获取第一文字作品与第二文字作品对应的待处理的多组作品单元,其中,本文档来自技高网...

【技术保护点】
1.一种用于识别文字作品异同的方法,其中,该方法包括:获取第一文字作品与第二文字作品对应的第一作品单元组,其中,所述第一作品单元组包括两个分别从所述第一文字作品、所述第二文字作品中对应部分提取的作品单元;根据所述第一作品单元组中两个作品单元分别生成所述第一作品单元组对应的两个数字指纹信息;若所述第一作品单元组对应的两个数字指纹信息不同,确定所述第一文字作品与所述第二文字作品不同。

【技术特征摘要】
1.一种用于识别文字作品异同的方法,其中,该方法包括:获取第一文字作品与第二文字作品对应的第一作品单元组,其中,所述第一作品单元组包括两个分别从所述第一文字作品、所述第二文字作品中对应部分提取的作品单元;根据所述第一作品单元组中两个作品单元分别生成所述第一作品单元组对应的两个数字指纹信息;若所述第一作品单元组对应的两个数字指纹信息不同,确定所述第一文字作品与所述第二文字作品不同。2.根据权利要求1所述的方法,其中,所述若所述第一作品单元组对应的两个数字指纹信息不同,确定所述第一文字作品与所述第二文字作品不同还包括:若所述第一作品单元组对应的两个数字指纹信息相同,确定所述第一文字作品与所述第二文字作品相同。3.根据权利要求1所述的方法,其中,所述若所述第一作品单元组对应的两个数字指纹信息不同,确定所述第一文字作品与所述第二文字作品不同还包括:若所述第一作品单元组对应的两个数字指纹信息相同,获取第二作品单元组,其中,所述第二作品单元组包括两个分别从所述第一文字作品、所述第二文字作品中对应部分提取的作品单元;根据所述第二作品单元组中两个作品单元分别生成所述第二作品单元组对应的两个数字指纹信息;若所述第二作品单元组对应的两个数字指纹信息不同,确定所述第一文字作品与所述第二文字作品不同。4.根据权利要求3所述的方法,其中,所述第二作品单元组满足以下至少任一项:所述第一作品单元组在所述第一文字作品中对应的提取部分与所述第二作品单元组在所述第一文字作品中对应的提取部分不同;所述第一作品单元组在所述第一文字作品中对应的提取部分真包含于所述第二作品单元组在所述第一文字作品中对应的提取部分;所述第一作品单元组在所述第一文字作品中对应的提取部分与所述第二作品单元组在所述第一文字作品中对应的提取部分相交为空;第一作品单元组中从所述第一文字作品中提取的作品单元,真包含于第二作品单元组中从所述第一文字作品中提取的作品单元。5.根据权利要求3或4所述的方法,其中,所述若所述第一作品单元组对应的两个数字指纹信息相同,获取第二作品单元组,其中,所述第二作品单元组包括两个分别从所述第一文字作品、所述第二文字作品中对应部分提取的作品单元包括:若所述第一作品单元组对应的两个数字指纹信息相同,且满足预定的继续比较触发条件,获取所述第二作品单元组,其中,所述第二作品单元组包括两个分别从所述第一文字作品、所述第二文字作品中对应部分提取的作品单元。6.根据权利要求5所述的方法,其中,所述继续比较触发条件包括以下至少任一项:所述第一文字作品与所述第二文字作品间已比较的作品单元组数量小于预定比较次数阈值信息;所述第一文字作品与所述第二文字作品间已确认相同的所有部分作品的文字数量小于预定比较数量阈值信息;所述第一文字作品与所述第二文字作品间已确认相同的所有部分作品的文字数量与所述第一文字作品或所述第二文字作品的总文字数量的比值信息,小于预定比较比例阈值信息。7.根据权利要求5或6所述的方法,其中,所述若所述第一作品单元组对应的两个数字指纹信息相同,且满足预定的继续比较触发条件,获取所述第二作品单元组,其中,所述第二作品单元组包括两个分别从所述第一文字作品、所述第二文字作品中对应部分提取的作品单元还包括:若所述第一作品单元组对应的两个数字指纹信息相同,且未满足所述继续比较触发条件,确定所述第一文字作品与所述第二文字作品相同。8.根据权利要求1所述的方法,其中,所述方法还包括:若所述第一文字作品与所述第二文字作品不同,根据所述第一文字作品与所述第二文字作品间已比较的作品单元组信息,确定所述第一文字作品与所述第二文字作品的相似度信息。9.根据权利要求8所述的方法,其中,所述若所述第一文字作品与所述第二文字作品不同,根据所述第一文字作品与所述第二文字作品间已比较的作品单元组信息,确定所述第一文字作品与所述第二文字作品的相似度信息包括:若所述第一文字作品与所述第二文字作品不同,获取第三作品单元组,根...

【专利技术属性】
技术研发人员:童小林
申请(专利权)人:上海掌门科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1