基于图神经网络的源码溯源方法、系统及可读存储介质技术方案

技术编号:40466134 阅读:30 留言:0更新日期:2024-02-22 23:20
本发明专利技术公开了基于图神经网络的源码溯源方法、系统及可读存储介质,其方法包括步骤:提取源码对比数据库;对源码进行向量化预处理;构建基于图卷积神经网络的源码特征表征模型;根据源码特征表征模型的图编辑距离计算源码相似度;根据源码相似度对源码进行溯源。本发明专利技术解决了相关技术中缺乏对源码的内容信息和逻辑关系的评估和无法精准溯源的问题。

【技术实现步骤摘要】

本专利技术属于软件安全,特别是涉及基于图神经网络的源码溯源方法、系统及可读存储介质


技术介绍

1、随着科学技术的不断进步和互联网中开源精神的不断发扬,开发人员可以通过开源代码仓库,例如github、码云、stack overflow等,迅速地获取到自己所需的代码片段,通过复制、修改等操作在自己的项目中引用已有的开源代码,大幅度地提高项目的开发效率。开源软件为信息技术行业带来了极大便利,提高了开发效率,降低了成本。然而,代码复用和抄袭的问题也随之而来。首先,代码抄袭对软件知识产权保护构成了巨大威胁,会对个人或公司带来负面影响甚至构成犯罪行为;其次,不考虑软件程序的数据和控制流程结构的代码复制-粘贴的操作,会降低程序的稳定能力,可能会带来代码缺陷传播和代码冗余等危害;再者,在软件国产化亟需发展的形势下,开源代码复用和抄袭会带来一定程度的阻碍,增加了代码维护难度和不可控性。因此,软件代码的溯源已成为软件供应链安全的重要研究方向。

2、现有的软件代码溯源方法主要通过最长公共子序列算法或余弦相似度算法等对单个字节码聚合行的特征进行相似度分析得到,缺乏对本文档来自技高网...

【技术保护点】

1.一种基于图神经网络的源码溯源方法,其特征在于,包括:

2.根据权利要求1所述的基于图神经网络的源码溯源方法,其特征在于,所述提取源码对比数据库,包括步骤:

3.根据权利要求2所述的基于图神经网络的源码溯源方法,其特征在于,所述对源码进行向量化预处理,包括步骤:

4.根据权利要求3所述的基于图神经网络的源码溯源方法,其特征在于,所述根据节点的类和/或方法和/或语句划分节点类型,包括步骤:

5.根据权利要求1所述的基于图神经网络的源码溯源方法,其特征在于,所述构建基于图卷积神经网络的源码特征表征模型,包括步骤:

<p>6.根据权利要求...

【技术特征摘要】

1.一种基于图神经网络的源码溯源方法,其特征在于,包括:

2.根据权利要求1所述的基于图神经网络的源码溯源方法,其特征在于,所述提取源码对比数据库,包括步骤:

3.根据权利要求2所述的基于图神经网络的源码溯源方法,其特征在于,所述对源码进行向量化预处理,包括步骤:

4.根据权利要求3所述的基于图神经网络的源码溯源方法,其特征在于,所述根据节点的类和/或方法和/或语句划分节点类型,包括步骤:

5.根据权利要求1所述的基于图神经网络的源码溯源方法,其特征在于,所述构建基于图卷积神经网络的源码特征表征模型,包括步骤:

6.根据权利要求5所述的基于图神经网络的源码溯源方法,其特征在于,所述根据一维卷积神经网络构建节点特征一维图神经网络模型是基于一维卷积神经网络构建节点特征提取层,对一维节点向量的特征进行表征;所述根据...

【专利技术属性】
技术研发人员:许艳萍刘博莫凡严军荣袁国平
申请(专利权)人:杭州安恒信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1