System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 软件供应链审计方法、系统及计算机可读存储介质技术方案_技高网

软件供应链审计方法、系统及计算机可读存储介质技术方案

技术编号:40879900 阅读:6 留言:0更新日期:2024-04-08 16:50
本发明专利技术涉及软件供应链审计方法、系统及计算机可读存储介质,审计方法包括:采集软件供应链审计数据;对采集的软件供应链审计数据进行数据分词,以转换得到Token序列;之后进行Embedding编码,得到待处理数据矩阵;对待处理数据矩阵进行归一化处理,之后进行位置编码,得到位置编码矩阵;将位置编码矩阵输入多头注意力机制网络结构进行计算,其计算结果通过多次Gibbs采样结合自回归的方式逐个生成输出序列中的每个Token,得到Token输出序列;将Token输出序列通过输出层计算,以输出审计结果;其中,输出层包括依次连接的归一化逆转换和前馈神经网络。本发明专利技术有效提高网络模型的精确性、灵活性、可解释性。

【技术实现步骤摘要】

本专利技术属于软件供应链,具体涉及一种软件供应链审计方法、系统及计算机可读存储介质


技术介绍

1、软件供应链安全是指在软件开发和交付过程中,保障软件系统各个环节的安全性,以防止恶意攻击、漏洞利用和恶意代码的注入。软件供应链包括从软件开发、测试、打包、分发到部署等各个环节,涉及多个参与方、组织和网络。在当前数字化时代,软件供应链攸关企业的业务运作和信息安全,因此需要给予足够的重视。

2、近年来,人工智能领域大语言模型技术深入到各个行业及领域中,为解决优化软件供应链技术审计阶段可能存在的问题,考虑结合开源的大语言模型并结合创新的技术要点适应性的开发应用在软件供应链技术审计模块中,由此设计软件供应链审计方案,其中包含软件供应链审计中代码审查、组件分析、安全测试等不同阶段的实现。


技术实现思路

1、基于现有技术中存在的上述不足,本专利技术的目的是提供一种软件供应链审计方法、系统及计算机可读存储介质。

2、为了达到上述专利技术目的,本专利技术采用以下技术方案:

3、一种软件供应链审计方法,包括以下步骤:

4、s1、采集软件供应链审计数据;

5、s2、基于tokenization对采集的软件供应链审计数据进行数据分词,以转换得到token序列;

6、s3、对token序列进行embedding编码,将token序列的每个token映射为一个实数向量,得到待处理数据矩阵;

7、s4、对待处理数据矩阵进行归一化处理,之后进行位置编码,得到位置编码矩阵;

8、s5、将位置编码矩阵输入多头注意力机制网络结构进行计算,其计算结果通过多次gibbs采样结合自回归的方式逐个生成输出序列中的每个token,得到token输出序列;

9、s6、将token输出序列通过输出层计算,以输出审计结果;其中,输出层包括依次连接的归一化逆转换和前馈神经网络。

10、作为优选方案,所述步骤s1中,软件供应链审计数据的类型包括代码审查、组件分析和安全测试。

11、作为优选方案,所述代码审查对应的软件供应链审计数据为代码片段或代码文件;

12、所述组件分析对应的软件供应链审计数据为组件知识图谱;

13、所述安全测试对应的软件供应链审计数据为软件供应链相关知识问题或相似度检测代码片段。

14、作为优选方案,所述步骤s4中,归一化处理采用均方根标准化。

15、作为优选方案,所述步骤s4中,位置编码采用旋转位置编码。

16、作为优选方案,所述步骤s5中,位置编码矩阵输入多头注意力机制网络结构进行计算的过程包括以下步骤:

17、s51、位置编码矩阵通过embedding层,通过三组矩阵运算得到query值、key值和value值;

18、s52、对key值和query值分别进行位置编码,并计算相似度得分;

19、s53、对相似度得分进行softmax的掩蔽操作后,与value值相结合得到计算结果。

20、作为优选方案,所述步骤s5中,每次生成一个token时,使用上一次已生成的token来预测下一个token。

21、作为优选方案,所述步骤s5中,前馈神经网络中选择swiglu激活函数。

22、本专利技术还提供一种软件供应链审计系统,应用如上任一项方案所述的审计方法,所述审计系统包括:

23、采集模块,用于采集软件供应链审计数据;

24、分词模块,用于基于tokenization对采集的软件供应链审计数据进行数据分词,以转换得到token序列;

25、编码模块,用于对token序列进行embedding编码,将token序列的每个token映射为一个实数向量,得到待处理数据矩阵;

26、归一化模块,用于对待处理数据矩阵进行归一化处理;

27、位置编码模块,用于对归一化处理之后的待处理数据矩阵进行位置编码,得到位置编码矩阵;

28、计算模块,用于将位置编码矩阵输入多头注意力机制网络结构进行计算;

29、生成模块,用于将多头注意力机制网络结构的计算结果通过多次gibbs采样结合自回归的方式逐个生成输出序列中的每个token,得到token输出序列;

30、输出模块,用于将token输出序列通过输出层计算,以输出审计结果;其中,输出层包括依次连接的归一化逆转换和前馈神经网络。

31、本专利技术还提供一种计算机可读存储介质,可读存储介质中存储有指令,当指令在计算机上运行时,使得计算机执行如上任一项方案所述的审计方法。

32、本专利技术与现有技术相比,有益效果是:

33、本专利技术基于软件供应链审计阶段开发设计包含代码审查、组件分析、安全测试等功能,在开源的大语言模型llama内部网络结构的基础上,结合各功能领域的适应性要求,调整其内部transformer中多头注意力机制及自回归生成中输出编码采样的要求,选择mcmc马尔可夫链蒙特卡洛采样的一种特殊形式,即gibbs采样进行迭代优化设计,以此来提高模型网络的精确性、灵活性和可解释性。

本文档来自技高网...

【技术保护点】

1.一种软件供应链审计方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的软件供应链审计方法,其特征在于,所述步骤S1中,软件供应链审计数据的类型包括代码审查、组件分析和安全测试。

3.根据权利要求2所述的软件供应链审计方法,其特征在于,所述代码审查对应的软件供应链审计数据为代码片段或代码文件;

4.根据权利要求1所述的软件供应链审计方法,其特征在于,所述步骤S4中,归一化处理采用均方根标准化。

5.根据权利要求1所述的软件供应链审计方法,其特征在于,所述步骤S4中,位置编码采用旋转位置编码。

6.根据权利要求1所述的软件供应链审计方法,其特征在于,所述步骤S5中,位置编码矩阵输入多头注意力机制网络结构进行计算的过程包括以下步骤:

7.根据权利要求1所述的软件供应链审计方法,其特征在于,所述步骤S5中,每次生成一个Token时,使用上一次已生成的Token来预测下一个Token。

8.根据权利要求1所述的软件供应链审计方法,其特征在于,所述步骤S5中,前馈神经网络中选择SwiGLU激活函数。

9.一种软件供应链审计系统,应用如权利要求1-8任一项所述的审计方法,其特征在于,所述审计系统包括:

10.一种计算机可读存储介质,可读存储介质中存储有指令,其特征在于,当指令在计算机上运行时,使得计算机执行如权利要求1-8任一项所述的审计方法。

...

【技术特征摘要】

1.一种软件供应链审计方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的软件供应链审计方法,其特征在于,所述步骤s1中,软件供应链审计数据的类型包括代码审查、组件分析和安全测试。

3.根据权利要求2所述的软件供应链审计方法,其特征在于,所述代码审查对应的软件供应链审计数据为代码片段或代码文件;

4.根据权利要求1所述的软件供应链审计方法,其特征在于,所述步骤s4中,归一化处理采用均方根标准化。

5.根据权利要求1所述的软件供应链审计方法,其特征在于,所述步骤s4中,位置编码采用旋转位置编码。

6.根据权利要求1所述的软件供应链审计方法,其特征在于,所述步骤s5...

【专利技术属性】
技术研发人员:陈晓莉林建洪蓝康波国毓芯赵祥廷朱崇
申请(专利权)人:浙江鹏信信息科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1