开源许可证和版权信息篡改的检测方法及系统技术方案

技术编号:29758242 阅读:18 留言:0更新日期:2021-08-20 21:11
本发明专利技术提出了一种开源许可证和版权信息篡改的检测方法及系统,检测方法,包括:建立同源分析特征知识库;将待检测文件的特征信息与同源分析特征知识库中的特征信息进行匹配,判断待检测文件是否与特征信息知识库中的文件具有同源关系;在判定待检测文件存在同源关系文件的情况下,记录同源关系文件,并将待检测文件的许可证和版权信息与同源关系文件的许可证和版权信息进行匹配校验,判断待检测文件中的许可证和版权信息是否有篡改、删除及新增现象。根据本发明专利技术的开源许可证和版权信息篡改的检测方法,解决了相关技术采用人工处理混源许可证篡改检测,而存在效率低、误报率高的问题,实现了开源许可证和版权信息篡改的自动检测,降低了成本和误报率,提升了效率、检出率以及检测质量。

【技术实现步骤摘要】
开源许可证和版权信息篡改的检测方法及系统
本专利技术涉及软件开发
,尤其涉及一种开源许可证和版权信息篡改的检测方法及系统。
技术介绍
据不完全统计,国内外软件开发中,高达99%的软件项目中或多或少使用了开源软件,涉及的领域也非常广泛,包括目前热门的区块链、人工智能、大数据、云计算、图像识别、工业软件等众多领域。同时,开源软件作者对于知识产权保护的意识也开始越发注重,软件作者一般情况下会对自己的软件产品声明相应的开源软件许可证,以此保护自己对于开源软件作品的合法保护,维护自己的合法权益。开发者在使用开源软件的时候,经常发生不合规使用开源软件的情况,比如著名的开源软件许可证Apache-2.0,明确声明软件开发者在使用开源代码时,需要保留原始的许可证声明和版权声明,但是在实际中,经常会发生开发者为了宣称类似“自研”等目的,有意或者无意的删除相关版权声明以及许可证声明信息,这在无形中就窃取了开源作者的果实,侵犯了开源作者的知识产权。基于以上背景,如何智能化鉴别是否引用了他人的开源软件作品,却有意或者无意篡改(含删除、修改)原作者的相关许可证和版权声明是一件非常有意义的事情,可以帮助软件开发人员合理、合规使用开源软件作品,规避潜在的法律诉讼风险和名誉损失。在相关涉及知识产权评测、知识产权纠纷等领域下也具有很大的作用。目前,针对混源软件开源许可证篡改检测,国内外均没有智能检测的方法,相关的需求场景也是较少,当需要做相关事情的时候,一般都是通过人眼看,逐个文件的识别判断。
技术实现思路
本专利技术要解决的技术问题是如何对开源许可证和版权信息篡改进行智能检测,本专利技术提供一种开源许可证和版权信息篡改的检测方法及系统。根据本专利技术实施例的开源许可证和版权信息篡改的检测方法,包括:建立同源分析特征知识库;将待检测文件的特征信息与所述同源分析特征知识库中的特征信息进行匹配,判断所述待检测文件是否与特征信息知识库中的文件具有同源关系;在判定所述待检测文件存在同源关系文件的情况下,记录同源关系文件,并将所述待检测文件的许可证和版权信息与同源关系文件的许可证和版权信息进行匹配校验,判断所述待检测文件中的许可证和版权信息是否有篡改、删除及新增现象。根据本专利技术实施例的开源许可证和版权信息篡改的检测方法,解决了相关技术采用人工处理混源许可证篡改检测,而存在效率低、误报率高的问题,实现了开源许可证和版权信息篡改的自动检测,降低了成本和误报率,提升了效率、检出率以及检测质量。根据本专利技术的一些实施例,在对所述待检测文件的许可证和版权信息进行匹配校验之前,所述方法还包括:建立许可证和版权信息知识库,用于存储开源许可证和版权的基础信息、条款信息。在本专利技术的一些实施例中,在对所述待检测文件的许可证和版权信息进行匹配校验时,将所述待检测文件的许可证和版权信息与所述许可证和版权信息知识库中的开源许可证和版权的基础信息、条款信息进行匹配校验。根据本专利技术的一些实施例,所述同源分析特征知识库中的特征信息包括:原文件级特征、文件级特征和代码片段级特征,所述将待检测文件与所述同源分析特征知识库中的特征信息进行匹配,判断所述待检测文件是存在同源关系文件,包括:将所述待检测文件与所述同源分析特征知识库中的原文件级特征进行匹配,判断所述待检测文件是否存在原文件同源的同源关系文件;将所述待检测文件与所述同源分析特征知识库中的文件级特征进行匹配,判断所述待检测文件是否存在文件级同源的同源关系文件;将所述待检测文件与所述同源分析特征知识库中的代码片段级特征进行匹配,判断所述待检测文件是否存在代码片段级同源的同源关系文件。在本专利技术的一些实施例中,所述原文件级特征、文件级特征和代码片段级特征中的至少一种为Hash特征。根据本专利技术实施例的开源许可证和版权信息篡改的检测系统,包括:第一知识库创建模块,用于建立同源分析特征知识库;同源关系判断模块,用于将待检测文件的特征信息与所述同源分析特征知识库中的特征信息进行匹配,判断所述待检测文件是否与特征信息知识库中的文件具有同源关系;许可证和版权校验模块,用于在判定所述待检测文件存在同源关系文件的情况下,记录同源关系文件,并将所述待检测文件的许可证和版权信息与同源关系文件的许可证和版权信息进行匹配校验,判断所述待检测文件中的许可证和版权信息是否有篡改、删除及新增现象。根据本专利技术实施例的开源许可证和版权信息篡改的检测系统,解决了相关技术采用人工处理混源许可证篡改检测,而存在效率低、误报率高的问题,实现了开源许可证和版权信息篡改的自动检测,降低了成本和误报率,提升了效率、检出率以及检测质量。根据本专利技术的一些实施例,所述系统还包括:第二知识库创建模块,用于建立许可证和版权信息知识库,以存储所述开源许可证和版权的基础信息、条款信息。在本专利技术的一些实施例中,所述系统还包括:提取模块,用于在对所述待检测文件的许可证和版权信息进行匹配校验时,将所述待检测文件的许可证和版权信息与所述许可证和版权信息知识库中的开源许可证和版权的基础信息、条款信息进行匹配校验。根据本专利技术的一些实施例,所述同源分析特征知识库中的特征信息包括:原文件级特征、文件级特征和代码片段级特征,所述同源关系判断模块,包括:第一判断模块,用于将所述待检测文件与所述同源分析特征知识库中的原文件级特征进行匹配,判断所述待检测文件是否存在原文件级同源的同源关系文件;第二判断模块,用于将所述待检测文件与所述同源分析特征知识库中的文件级特征进行匹配,判断所述待检测文件是否为存在文件级同源的同源关系文件;第三判断模块,用于将所述待检测文件与所述同源分析特征知识库中的代码片段级特征进行匹配,判断所述待检测文件是否为存在代码片段级同源的同源关系文件。在本专利技术的一些实施例中,所述原文件级特征、文件级特征和代码片段级特征中的至少一种为Hash特征。附图说明图1为根据本专利技术实施例的开源许可证和版权信息篡改的检测方法流程图;图2为根据本专利技术实施例的开源许可证和版权信息篡改的检测方法示意图;图3为根据本专利技术实施例的同源关系判断方法流程图;图4为根据本专利技术实施例的待检测文件的文件许可证和版权信息提取流程图;图5为根据本专利技术实施例的开源许可证和版权信息篡改的检测系统示意图。附图标记:检测系统100,第一知识库创建模块10,同源关系判断模块20,许可证和版权校验模块30。具体实施方式为更进一步阐述本专利技术为达成预定目的所采取的技术手段及功效,以下结合附图及较佳实施例,对本专利技术进行详细说明如后。相关技术中,针对混源软件开源许可证篡改检测,一般都是通过人眼看,逐个文件的识别判断。存在如下缺陷:成本高、效率低、误报率高、检出率低、因为人员素质的参差不齐,检出结果质量不一。针对上述问题,本专利技术提出一种开源许可本文档来自技高网...

【技术保护点】
1.一种开源许可证和版权信息篡改的检测方法,其特征在于,包括:/n建立同源分析特征知识库;/n将待检测文件的特征信息与所述同源分析特征知识库中的特征信息进行匹配,判断所述待检测文件是否与特征信息知识库中的文件具有同源关系;/n在判定所述待检测文件存在同源关系文件的情况下,记录同源关系文件,并将所述待检测文件的许可证和版权信息与同源关系文件的许可证和版权信息进行匹配校验,判断所述待检测文件中的许可证和版权信息是否有篡改、删除及新增现象。/n

【技术特征摘要】
1.一种开源许可证和版权信息篡改的检测方法,其特征在于,包括:
建立同源分析特征知识库;
将待检测文件的特征信息与所述同源分析特征知识库中的特征信息进行匹配,判断所述待检测文件是否与特征信息知识库中的文件具有同源关系;
在判定所述待检测文件存在同源关系文件的情况下,记录同源关系文件,并将所述待检测文件的许可证和版权信息与同源关系文件的许可证和版权信息进行匹配校验,判断所述待检测文件中的许可证和版权信息是否有篡改、删除及新增现象。


2.根据权利要求1所述的开源许可证和版权信息篡改的检测方法,其特征在于,在对所述待检测文件的许可证和版权信息进行匹配校验之前,所述方法还包括:
建立许可证和版权信息知识库,用于存储开源许可证和版权的基础信息、条款信息。


3.根据权利要求2所述的开源许可证和版权信息篡改的检测方法,其特征在于,在对所述待检测文件的许可证和版权信息进行匹配校验时,将所述待检测文件的许可证和版权信息与所述许可证和版权信息知识库中的开源许可证和版权的基础信息、条款信息进行匹配校验。


4.根据权利要求1所述的开源许可证和版权信息篡改的检测方法,其特征在于,所述同源分析特征知识库中的特征信息包括:原文件级特征、文件级特征和代码片段级特征,所述将待检测文件与所述同源分析特征知识库中的特征信息进行匹配,判断所述待检测文件是存在同源关系文件,包括:
将所述待检测文件与所述同源分析特征知识库中的原文件级特征进行匹配,判断所述待检测文件是否存在原文件级同源的同源关系文件;
将所述待检测文件与所述同源分析特征知识库中的文件级特征进行匹配,判断所述待检测文件是否存在文件级同源的同源关系文件;
将所述待检测文件与所述同源分析特征知识库中的代码片段级特征进行匹配,判断所述待检测文件是否存在代码片段级同源的同源关系文件。


5.根据权利要求4所述的开源许可证和版权信息篡改的检测方法,其特征在于,所述原文件级特征、文件级特征和代码片段级特征中的至少一种为Hash特征。


6.一种开源许可...

【专利技术属性】
技术研发人员:梁大功易焕腾李馨宁但吉兵罗峋
申请(专利权)人:苏州棱镜七彩信息科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1