【技术实现步骤摘要】
一种基于FPGA随机森林模型的流量分类方法及系统
本专利技术涉及流量分类领域,特别是涉及一种基于现场可编程逻辑门阵列(FieldProgrammableGateArray,FPGA)随机森林模型的流量分类方法及系统。
技术介绍
流量分类技术是网络管理与安全的基础。在当前网络中,加密流量占比不断增长,网络中出现了大量的SSL/TLS/VPN等协议为主的加密流量,网络流量分类也带来挑战,给流量采集,还原等业务带了新的问题,而传统基于端口,协议,dpi引擎等技术已不能满足流量实时的分类的需求。即现有的流量分类方法存在分类速度慢的问题,不能够实现对网络流量的实时分类。
技术实现思路
本专利技术的目的是提供一种基于FPGA随机森林模型的流量分类方法及系统,提高流量分类速率。为实现上述目的,本专利技术提供了如下方案:一种基于FPGA可扩展随机森林模型的高速流量分类方法,所述方法包括:获取待分类的网络数据流和经过软件训练的随机森林模型;控制FPGA存储所述待分类的网络数据流并加载所述随机 ...
【技术保护点】
1.一种基于FPGA可扩展随机森林模型的高速流量分类方法,其特征在于,所述方法包括:/n获取待分类的网络数据流和经过软件训练的随机森林模型;/n控制FPGA存储所述待分类的网络数据流并加载所述随机森林模型;/n提取所述待分类的网络数据流的特征参量;/n根据所述特征参量和所述随机森林模型对所述待分类的网络数据流进行分类。/n
【技术特征摘要】
1.一种基于FPGA可扩展随机森林模型的高速流量分类方法,其特征在于,所述方法包括:
获取待分类的网络数据流和经过软件训练的随机森林模型;
控制FPGA存储所述待分类的网络数据流并加载所述随机森林模型;
提取所述待分类的网络数据流的特征参量;
根据所述特征参量和所述随机森林模型对所述待分类的网络数据流进行分类。
2.根据权利要求1所述的基于FPGA可扩展随机森林模型的高速流量分类方法,其特征在于,
所述随机森林模型包括若干个树;
每个树包括若干个单元;
所述单元为根结点单元、结点单元或叶子结点单元;
每个单元均包括标志信息,所述标志信息用于确定对应的单元执行的操作。
3.根据权利要求2所述的基于FPGA可扩展随机森林模型的高速流量分类方法,其特征在于,所述根据所述特征参量和所述随机森林模型对所述网络数据流进行分类具体包括:
控制所述待识别的网络数据流分别流入每个树进行分类识别,得到各树的识别结果;
计算所述各树的识别结果的比例,选择比例最大的识别结果作为所述待分类的网络数据流的分类结果。
4.根据权利要求3所述的基于FPGA可扩展随机森林模型的高速流量分类方法,其特征在于,所述控制所述待识别的网络数据流分别流入每个树进行分类识别,得到各树的识别结果具体包括:
针对每个树均执行以下操作:
控制所述待识别的网络数据流从树的根结点单元依次流过树的各个结点单元至叶子结点单元;
获取当前操作的单元的标志信息;
判断所述标志信息是否为第一标志,得到第一判断结果;
若所述第一判断结果为是,则控制对应的单元读取存储所述待识别的网络数据流的节点信息,进行二叉树运算,得到第一运算结果,并根据所述第一运算结果输出第一运算信息至下一单元,返回步骤“获取当前操作的单元的标志信息”;所述节点信息包括特征参量和节点地址;
若所述第一判断结果为否,则判断所述标志信息是否为第二标志,得到第二判断结果;
若所述第二判断结果为是,则控制对应的单元进行跨单元运算,得到第二运算结果,并根据所述第二运算结果输出第二运算信息至下一单元,返回步骤“获取当前操作的单元的标志信息”;
若所述第二判断结果为否,则判断对应的单元是否为首层,得到第三判断结果;
若所述第三判断结果为是,则输出树的识别结果;
若所述第三判断结果为否,则控制对应的单元输出第三标志至下一单元并返回步骤“获取当前操作的单元的标志信息”。
5.根据权利要求4所述的基于FPGA可扩展随机森林模型的高速流量分类方法,其特征在于,
所述根据所述第一运算结果输出第一运算信息至下一单元具体包括:
判断所述第一运算结果是否为进行下一层二叉树运算且节点在下一个单元,得到第四判断结果;
若所述第四判断结果为是,则控制输出的所述第一运算信息为所述第一标志和所述节点地址;
若所述第四判断结果为否,则判断所述第一运算结果是否为进行下一层二叉树运算且节点不...
【专利技术属性】
技术研发人员:陈曙晖,王飞,赵双,李振兴,陈璐,王小峰,张博锋,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。