一种随机森林的边缘计算终端安全等级评估方法技术

技术编号:21892638 阅读:20 留言:0更新日期:2019-08-17 14:47
本发明专利技术公开了一种随机森林的边缘计算侧终端安全等级评估方法,包括以下步骤:S1.设定终端个安全测试单项以及各个测试单项的测试结果;S2.对接入的智能终端进行测试,S3.确定智能终端安全等级和单项测试结果集的对应关系;S4.计算每个边缘终端对应的安全等级,得到数据集;S5.将数据集划分为训练集和测试集;S6.将训练集输入随机森林进行训练,得到成熟的分类器模型;S7.将测试集输入训练得到的随机森林分类器模型中,得到测试结果与步骤S4安全等级对比得到达标分类器;S8.利用达标分类器模型评估新接入的终端安全等级。本发明专利技术将边缘终端的数据安全需求按等级划分,根据面临的安全风险、系统复杂度,能够通过量化的客观标准进行边缘计算侧终端安全评估。

An Evaluation Method of Terminal Security Level for Random Forest Edge Computing

【技术实现步骤摘要】
一种随机森林的边缘计算终端安全等级评估方法
本专利技术涉及边缘计算终端安全等级评估方法,特别是涉及一种随机森林的边缘计算终端安全等级评估方法。
技术介绍
随着万物互联的飞速发展及广泛应用,智能终端将成为万物互联关键节点,并产生海量实时数据。根据IDC统计数据,到2020年将有超过500亿个终端和设备接入网络,其中超过50%的数据需要在网络边缘侧分析、处理与存储。大量边缘设备产生的海量数据需要更敏捷的连接、更有效的数据处理,同时要有更好的数据保护。面对大量异构终端接入物联网,边缘计算侧也面临着更大的数据安全威胁和隐患,存在一些不受信任的终端及移动边缘应用开发者的非法接入问题。因此,需要对边缘计算终端的数据安全需求按等级划分,在终端、边缘节点、边缘计算服务之间建立新的安全接入机制,以保证数据的机密性、完整性、用户信息隐私性。这种背景下,对于边缘计算终端的安全性能进行测评,首先在边缘计算侧对终端安全进行单项测评,根据各测试单项的测试结果科学计算,进行终端安全等级的划分,实现不同安全级别需求的安全使用,达到智能终端安全有效。边缘侧的计算资源支持,使得其可以采用较为复杂的计算方法进行终端安全性能评估,实现终端安全等级的客观、有效和精确划分,本专利提出将终端和数据安全需求按等级划分,根据面临的安全风险、系统复杂度等,通过量化的客观标准进行边缘计算侧终端安全等级的评测。随机森林(Randomforest)是2001年由LeoBreiman提出的机器学习算法,主要应用于回归和分类。它的基本思想是利用自助法(bootstrap)重采样技术和节点随机分裂技术构建多棵决策树,从原始训练样本集N中有放回地重复随机抽取k个样本生成新的训练样本集合,然后根据自助样本集生成k个分类树组成随机森林,通过分类树投票得到新数据的分类结果。基于边缘计算能力的支撑,在随机森林算法下实现智能终端的数据安全需求按等级划分,对于实现边缘计算系统安全性能的最大优化具有重大意义。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种随机森林的边缘计算终端安全等级评估方法,根据智能终端各单项安全性能的测试得到测试结果,并采用随机森林算法进行智能终端的安全等级划分,提高了安全等级划分的准确性。本专利技术的目的是通过以下技术方案来实现的:一种随机森林的边缘计算侧终端安全等级评估方法,包括以下步骤:S1.在边缘计算侧搭建安全测试平台,设定终端的k个测试单项,每个测试单项的测试结果为0或1,其中0表示不通过,1表示通过;S2.在边缘侧的安全测试平台上,按照k个测试单项对m+n台智能终端进行测试,得到每一台智能终端的安全性能单项测试结果集,其中第i台智能终端的安全性能单项测试结果集为:Xi=[xi1,xi2,...,xik],i=1,2,...,m+n;其中,xij为第i台智能终端的第j个测试单项得分,j=1,2,...,k;将所有智能终端的单项测试结果用(m+n)*k维矩阵X表示:S3.确定智能终端安全等级和单项测试结果集的对应关系;S4.按照步骤S3中的对应关系,计算每个Xi=[xi1,xi2,...,xik]对应的安全等级yi,计算完毕后得到数据集D={(X1,y1),(X2,y2),...,(Xm+n,ym+n)};S5.划分数据集D,取数据集D的前m项为训练集T,后n项为测试集S:训练集T={(X1,y1),(X2,y2),...,(Xm,ym)},占数据集的比例为测试集S={(Xm+1,ym+1),(Xm+2,ym+2),...,(Xm+n,ym+n)},占数据集的比例为优选地,训练集T和测试集S的大小可以调整,数据集越大,训练集数据越多,训练效果越好,对测试集的分类越准确;S6.将训练集T={(X1,y1),(X2,y2),...,(Xm,ym)}作为样本集合,输入随机森林分类器模型中进行训练,得到成熟的分类器模型;S7.训练完成后,将测试集S={(Xm+1,ym+1),(Xm+2,ym+2),...,(Xm+n,ym+n)}输入训练得到的随机森林分类器模型中,得到测试结果与步骤S4安全等级对比得到达标分类器;S8.将新接入的待测边缘计算侧智能终端接入安全测试平台得到测试结果,输入达标的分类器模型中进行评估,得到对应的安全等级。进一步地,所述步骤S3包括以下子步骤:S31.将智能终端的安全等级划分为y类;S32.令第i台智能终端的测试单项总得分0≤sumi≤k;S33.以为间隔确定安全等级划分范围,当时,第i台智能终端的安全等级为0,时安全等级为1,时安全等级为2,以此类推,时安全等级为t,t=1,2,...,y-1;sumi越大表示智能终端的安全性能越好。进一步地,所述步骤S6包括以下子步骤:S61.选择随机森林算法构建随机森林分类器模型,它属于Bagging类型,通过组合多个弱分类器,最终结果通过投票或取均值,使得整体模型的结果具有较高的精确度和泛化性能;S62.将训练集T={(X1,y1),(X2,y2),...,(Xm,ym)}划分为少数类样本集Tmin和多数类样本集Tmax,其中,并且Tmin∩Tmax={T};S63.从原始样本集中随机的抽取三分之二个样本点,得到训练集T′,观察T′的少数类数据集Tmin′,多数类数据集Tmax′;S64.计算值,给出条件且S65.如果训练集T′满足S64中的条件,则保存抽取得到的训练集,若训练集T′不满足S64中的条件,则舍弃抽取得到训练集;S66.重复步骤S63~S65,直至得到Ntree个满足条件的训练集,其中,Ntree为拟构造决策树数量,最终得到的Ntree个训练集为其中i=1,2,...,Ntree;S67.在i=1,2,...,Ntree时,利用训练集Ti,训练一个CART决策树Hi,依据Gini指标选取最优特征。其中,所述步骤S62包括以下子步骤:S621.统计训练集T={(X1,y1),(X2,y2),...,(Xm,ym)}中各个安全等级的样本数目;S622.对于每一个安全等级,若其对应的样本数目大于预设阈值H,则将该安全等级的所有样本加入多数类样本集Tmax;若其对应的样本数目小于或等于预设阈值H,将该安全等级的所有样本加入少数类样本集Tmin。其中,所述步骤S67包括以下子步骤:S671.对于训练集Ti,计算基尼指数Gini,Gini指数越小表示集合中被选中的样本被分错的概率越小,也就是说集合的纯度越高,反之,集合越不纯;其中Pk表示分类结果中第k个类别出现的频率;S672.对于含有N个样本的训练集Ti,根据属性A的第i个属性值,将数据集Ti划分成两部分,计算出Gain_GINI,其中n1、n2为样本子集Ti1、Ti2的样本个数;S673.对于属性A,分别计算任意属性值将数据集划分成两部分之后的Gain_GINI,选取其中的最小值,作为属性A得到的最优二分方案:S674.对于样本集Ti,计算所有属性的最优二分方案,选取其中的最小值,作为样本集Ti的最优二分方案:进一步地,所述步骤S7包括以下子步骤:S71.测试集S={(Xm+1,ym+1),(Xm+2,ym+2),...,(Xm+n,ym+n)}为待测样本;S72.对于i=1,2,...,Ntree,决策树初始投票权重为本文档来自技高网
...

【技术保护点】
1.一种随机森林的边缘计算侧终端安全等级评估方法,其特征在于:包括以下步骤:S1.在边缘计算侧搭建安全测试平台,设定终端的k个测试单项,每个测试单项的测试结果为0或1,其中0表示不通过,1表示通过;S2.在边缘侧的安全测试平台上,按照k个测试单项对m+n台智能终端进行测试,得到每一台智能终端的安全性能单项测试结果集,其中第i台智能终端的安全性能单项测试结果集为:Xi=[xi1,xi2,...,xik],i=1,2,...,m+n;其中,xij为第i台智能终端的第j个测试单项得分,j=1,2,...,k;将所有智能终端的单项测试结果用(m+n)*k维矩阵X表示:

【技术特征摘要】
1.一种随机森林的边缘计算侧终端安全等级评估方法,其特征在于:包括以下步骤:S1.在边缘计算侧搭建安全测试平台,设定终端的k个测试单项,每个测试单项的测试结果为0或1,其中0表示不通过,1表示通过;S2.在边缘侧的安全测试平台上,按照k个测试单项对m+n台智能终端进行测试,得到每一台智能终端的安全性能单项测试结果集,其中第i台智能终端的安全性能单项测试结果集为:Xi=[xi1,xi2,...,xik],i=1,2,...,m+n;其中,xij为第i台智能终端的第j个测试单项得分,j=1,2,...,k;将所有智能终端的单项测试结果用(m+n)*k维矩阵X表示:S3.确定智能终端安全等级和单项测试结果集的对应关系;S4.按照步骤S3中的对应关系,计算每个Xi=[xi1,xi2,...,xik]对应的安全等级yi,计算完毕后得到数据集D={(X1,y1),(X2,y2),...,(Xm+n,ym+n)};S5.划分数据集D,取数据集D的前m项为训练集T,后n项为测试集S:训练集T={(X1,y1),(X2,y2),...,(Xm,ym)},占数据集的比例为测试集S={(Xm+1,ym+1),(Xm+2,ym+2),...,(Xm+n,ym+n)},占数据集的比例为S6.将训练集T={(X1,y1),(X2,y2),...,(Xm,ym)}作为样本集合,输入随机森林分类器模型中进行训练,得到成熟的分类器模型;S7.训练完成后,将测试集S={(Xm+1,ym+1),(Xm+2,ym+2),...,(Xm+n,ym+n)}输入训练得到的随机森林分类器模型中,得到测试结果与步骤S4安全等级对比得到达标分类器;S8.将新接入的待测边缘计算侧智能终端接入安全测试平台得到测试结果,输入达标的分类器模型中进行评估,得到对应的安全等级。2.根据权利要求1所述的一种随机森林的边缘计算侧终端安全等级评估方法,其特征在于:所述步骤S3包括以下子步骤:S31.将智能终端的安全等级划分为y类;S32.令第i台智能终端的测试单项总得分S33.以为间隔确定安全等级划分范围,当时,第i台智能终端的安全等级为0,时安全等级为1,时安全等级为2,以此类推,时安全等级为t,t=1,2,...,y-1;sumi越大表示智能终端的安全性能越好。3.根据权利要求1所述的一种随机森林的边缘计算侧终端安全等级评估方法,其特征在于:所述步骤S6包括以下子步骤:S61.选择随机森林算法构建随机森林分类器模型,它属于Bagging类型,通过组合多个弱分类器,最终结果通过投票或取均值,使得整体模型的结果具有较高的精确度和泛化性能;S62.将训练集T={(X1,y1),(X2,y2),...,(Xm,ym)}划分为少数类样本集Tmin和多数类样本集Tmax,其中,并且TminTmax={T};S63.从原始样本集中随机的抽取三分之二个样本点,得到训练集T′,观察T′的少数类数据集Tmin′,多数类数据集Tmax′;S...

【专利技术属性】
技术研发人员:雷文鑫文红侯文静刘文洁
申请(专利权)人:电子科技大学南方电网科学研究院有限责任公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1