一种基于多任务学习的智能合约漏洞检测方法技术

技术编号：32776983 阅读：11 留言：0更新日期：2022-03-23 19:33

本发明专利技术公开了一种基于多任务学习的智能合约漏洞检测方法，利用基于硬参数共享的多任务学习框架实现智能合约漏洞检测技术。首先在数据准备阶段，对智能合约数据集进行清洗，并通过现有检测工具进行漏洞分类及标签标记；在数据预处理阶段，将智能合约样本源码编译形成字节码，然后对字节码进行清洗处理，然后反编译转化成操作码序列，形成模型的输入；接着在模型构建阶段，构建基于多任务学习的智能合约检测模型；最后在训练阶段，按照数据预处理阶段得到的操作码序列输入到模型中进行训练，实现对漏洞的判断及检测。该模型在智能合约的数据集上展现了较好的识别功能，检测时间较短且恒定，而且由于多任务学习的特性，该模型具有较好的泛化能力。较好的泛化能力。较好的泛化能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多任务学习的智能合约漏洞检测方法

[0001]本专利技术属于区块链智能合约安全
，具体涉及一种针对智能合约的基于多任务学习(MTL,Multi
‑
Task Learning)的漏洞检测方法。

技术介绍

[0002]区块链技术，是一种按照时间顺序将数据区块以顺序相连的方式组合形成的一种链式数据结构，并以密码学方式保证的不可篡改和不可伪造的分部署账本。从宏观角度上说，区块链技术是利用块链式数据结构来验证与存储数据、利用分布式节点共识算法来生成和更新数据、利用密码学的方式保证数据传输和访问的安全、利用智能合约来编程和操作数据的一种全新的分布式基础架构与计算方式。
[0003]智能合约是执行合约条款的计算机交易协议，其本质上是一段可以执行的代码，当用户访问到该地址上时，智能合约将会自动运行。随着技术的不断发展，智能合约被广泛运用到各种领域，特别是金融和保险领域。尽管智能合约的快速发展带来了种种好处，但它的安全问题也令众多研究人员倍加关注。自2016年起，每年因智能合约漏洞而导致的安全事件层出不穷，造成了严重的资产经济损失。因此，如何有效快速的检测智能合约漏洞成为学术界研究的重点问题。目前国内对智能合约的漏洞检测主要依赖于符号执行、形式化验证、模糊测试及其他技术等。但这些方法都各有缺点，如基于符号分析的漏洞检测技术速度较慢，耗费时间长；基于形式化方法的漏洞检测方法准确率高，但花费成本高，且局限于已知漏洞，对未知漏洞的形式无法分析或检测；基于模糊测试的漏洞检测技术则受困于随机测试的生成策略...

【技术保护点】

【技术特征摘要】
1.一种基于多任务学习的智能合约漏洞检测方法，其特征在于，包括：(1)在数据准备阶段，对智能合约样本集进行漏洞分类及标签标记；(2)在数据预处理阶段，将智能合约源码进行编译转化为合约字节码，同时删除无效字节码，然后将有效字节码进行反编译转化为操作码序列，作为模型的输入；(3)在模型构建阶段，构建基于硬参数共享的多任务学习框架；在框架的底部共享层，构建基于自注意力的特征网络层，提取学习操作码序列特征；并在特定任务层，针对漏洞判断任务，建立基于卷积神经网络的二分类模型；针对漏洞识别任务，建立基于卷积神经网络的多标签分类模型，作为智能合约的漏洞检测模型；(4)在智能合约漏洞检测阶段，按照数据预处理阶段的处理方式将待检测智能合约处理成操作码序列，然后输入到基于多任务的智能合约漏洞检测模型，实现多任务功能，包括漏洞的判断、多种漏洞的检测。2.根据权利要求1所述的一种基于多任务学习的智能合约漏洞检测方法，其特征在于，所述数据准备阶段包括：(1)根据所需实现检测的漏洞类型，收集并获取智能合约数据集；(2)对智能合约数据集进行清洗，获得有效的智能合约数据样本；(3)对智能合约数据样本进行分类标记：借用漏洞检测工具对智能合约样本进行漏洞检测分析，根据漏洞类型对每个智能合约进行样本标记，包含是否存在漏洞的标签，以及漏洞类型；(4)所述标签为N＝[n1,n2,...,n
k
]，其中，k表示需要实现检测的多种漏洞类型，n
i
＝0表示智能合约样本不属于第n种漏洞，n

【专利技术属性】
技术研发人员：黄静，周阔，韩红桂，公备，王茜，卜奎健，王梦晓，李东萌，丁金飞，
申请(专利权)人：北京工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人