一种开源存储库恶意包检测方法及系统技术方案

技术编号：35299576 阅读：30 留言：0更新日期：2022-10-22 12:47

本发明专利技术属于网络安全技术领域，具体涉及一种开源存储库恶意包检测方法及系统；该方法包括：获取待检测Python包，对包进行特征提取，特征包括元数据特征、静态特征和动态特征；对元数据特征、静态特征和动态特征进行处理，得到总特征向量；采用训练好的RNN

全部详细技术资料下载

【技术实现步骤摘要】
一种开源存储库恶意包检测方法及系统

[0001]本专利技术属于网络安全
，具体涉及一种开源存储库恶意包检测方法及系统。

技术介绍

[0002]开源存储库是代码共享的平台，在软件供应链和软件开发过程中起着至关重要的作用。随着近年来开源软件不断深入到各类研究和生产领域，可以预见在不久的将来，开源软件供应链安全性的影响会更广泛，因此开源软件供应链的安全风险不容忽视。
[0003]加强开源软件供应链的安全审查，从技术和管理两个层面上有效地监督和推动开发人员及管理人员持续提高开源软件供应链的安全保障程度。在恶意开源软件代码数量呈指数级增长的态势下，可应用传统机器学习或深度学习对代码及其变种进行特征提取和分析，构建开源软件代码漏洞库。加强新型开源软件供应链安全防护技术的应用探索，对可能的开源软件供应链安全风险进行态势感知，将非法入侵的病毒尽早扼杀，保障开源软件供应链的安全。
[0004]传统的恶意包检测方法对恶意包提取的特征表现效果和提取效率不佳，导致恶意包检测方法效果不佳；基于不同包名之间的距离以及其他元数据差异的检测方法，因为缺少代码级别的分析，仅能区分恶意包和正常包表面上的差异；传统的综合元数据、静态和动态特征来进行检测的方法，会产生过大的资源开销。
[0005]综上所述，亟需一种能提高恶意包检测效果并能减少资源开销的恶意包检测方法。

技术实现思路

[0006]针对现有技术存在的不足，本专利技术提出了一种开源存储库恶意包检测方法及系统，该方法包括：
[0007]S1：获...

【技术保护点】

【技术特征摘要】
1.一种开源存储库恶意包检测方法，其特征在于，包括：S1：获取待检测Python包，对包进行特征提取，特征包括元数据特征、静态特征和动态特征；其中，元数据特征包括包名的编辑距离、包的作者、包文件的大小和包的下载历史，静态特征包括文本特征、ssdeep Hash、API调用序列和混淆特征，动态特征包括动态行为序列；S2：对元数据特征、静态特征和动态特征进行处理，得到总特征向量；S3：采用训练好的RNN
‑
Attention模型对总特征向量进行处理，得到恶意包检测结果。2.根据权利要求1所述的一种开源存储库恶意包检测方法，其特征在于，对ssdeep Hash进行提取的过程包括：收集恶意包样本，并根据恶意包样本构建Hash库；根据待检测包和Hash库计算ssdeep Hash。3.根据权利要求1所述的一种开源存储库恶意包检测方法，其特征在于，对API调用序列进行提取的过程包括：判断待检测包的类型并根据判断结果对待检测包进行解包，得到解包结果；采用正则表达式对解包结果进行处理，构建包入口文件的多叉树依赖关系图；后序遍历包入口文件的多叉树依赖关系图，根据后序遍历顺序导入图中节点对应的源代码，得到带检测包的完整源代码；根据完整源代码得到抽象语法树，对抽象语法树进行处理，得到API调用函数名和参数并将其作为API调用序列。4.根据权利要求3所述的一种开源存储库恶意包检测方法，其特征在于，对待检测包进行解包的过程包括：对于tar.gz格式的包提取setup.py和__init__.py文件，并清理tar.gz源码包中的其他文件；对于whl格式的包提取__init__.py文件，并清理whl包中的wheel文件。5.根...

【专利技术属性】
技术研发人员：程克非，刘小川，张亮，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人