【技术实现步骤摘要】
本专利技术属于软件安全,特别是涉及基于图神经网络的源码溯源方法、系统及可读存储介质。
技术介绍
1、随着科学技术的不断进步和互联网中开源精神的不断发扬,开发人员可以通过开源代码仓库,例如github、码云、stack overflow等,迅速地获取到自己所需的代码片段,通过复制、修改等操作在自己的项目中引用已有的开源代码,大幅度地提高项目的开发效率。开源软件为信息技术行业带来了极大便利,提高了开发效率,降低了成本。然而,代码复用和抄袭的问题也随之而来。首先,代码抄袭对软件知识产权保护构成了巨大威胁,会对个人或公司带来负面影响甚至构成犯罪行为;其次,不考虑软件程序的数据和控制流程结构的代码复制-粘贴的操作,会降低程序的稳定能力,可能会带来代码缺陷传播和代码冗余等危害;再者,在软件国产化亟需发展的形势下,开源代码复用和抄袭会带来一定程度的阻碍,增加了代码维护难度和不可控性。因此,软件代码的溯源已成为软件供应链安全的重要研究方向。
2、现有的软件代码溯源方法主要通过最长公共子序列算法或余弦相似度算法等对单个字节码聚合行的特征进行相
...【技术保护点】
1.一种基于图神经网络的源码溯源方法,其特征在于,包括:
2.根据权利要求1所述的基于图神经网络的源码溯源方法,其特征在于,所述提取源码对比数据库,包括步骤:
3.根据权利要求2所述的基于图神经网络的源码溯源方法,其特征在于,所述对源码进行向量化预处理,包括步骤:
4.根据权利要求3所述的基于图神经网络的源码溯源方法,其特征在于,所述根据节点的类和/或方法和/或语句划分节点类型,包括步骤:
5.根据权利要求1所述的基于图神经网络的源码溯源方法,其特征在于,所述构建基于图卷积神经网络的源码特征表征模型,包括步骤:
< ...【技术特征摘要】
1.一种基于图神经网络的源码溯源方法,其特征在于,包括:
2.根据权利要求1所述的基于图神经网络的源码溯源方法,其特征在于,所述提取源码对比数据库,包括步骤:
3.根据权利要求2所述的基于图神经网络的源码溯源方法,其特征在于,所述对源码进行向量化预处理,包括步骤:
4.根据权利要求3所述的基于图神经网络的源码溯源方法,其特征在于,所述根据节点的类和/或方法和/或语句划分节点类型,包括步骤:
5.根据权利要求1所述的基于图神经网络的源码溯源方法,其特征在于,所述构建基于图卷积神经网络的源码特征表征模型,包括步骤:
6.根据权利要求5所述的基于图神经网络的源码溯源方法,其特征在于,所述根据一维卷积神经网络构建节点特征一维图神经网络模型是基于一维卷积神经网络构建节点特征提取层,对一维节点向量的特征进行表征;所述根据...
【专利技术属性】
技术研发人员:许艳萍,刘博,莫凡,严军荣,袁国平,
申请(专利权)人:杭州安恒信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。