System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及一种风险判定系统,具体涉及一种商用密码应用安全性评估高风险项自动化判定方法。
技术介绍
1、商用密码应用安全性评估是指在采用商用密码技术、产品和服务集成建设的网络和信息系统中,对其密码应用的合规性、正确性和有效性等进行评估。商用密码应用安全性评估对规范密码应用和保障信息系统安全具有重大意义。
2、在商用密码应用安全性评估中高风险项判定是至关重要的一部分,在测评过程中,若出现高风险项,则直接导致商用密码应用安全性评估不符合要求。高风险项判定需要经验丰富的从业人员根据相关指导文件结合实际情况进行判定,是一项专业性极强的工作,其有着极高的技术门槛,不具备普适性。
3、因此,亟需一种商用密码应用安全性评估高风险项自动化判定方法,来解决商用密码应用安全性评估中高风险项判定的技术门槛高的问题。
技术实现思路
1、本专利技术针对现有技术中的不足,提供一种商用密码应用安全性评估高风险项自动化判定方法,以解决商用密码应用安全性评估中高风险项判定的技术门槛高的问题。
2、为实现上述目的,本专利技术采用以下技术方案:
3、一种商用密码应用安全性评估高风险项自动化判定方法,其特征在于,包括如下步骤:
4、导入指导文本,并将导入的指导文本切割成数个文本块,使用text2vec技术对切割后的文本块进行embedding,然后存入向量数据库;运用专家数据库中的历史测评数据作为训练数据,并使用catboost模型为每个测评点建模,得到风险值
5、将现场测评文档导入,提取现场测评文档中的所需信息形成初始query;通过专家数据库对初始query进行关键字的提取,并将关键字与分类标识符和安全问题进行拼接,随后使用text2vec技术进行embedding;
6、通过向量相似度算法从向量数据库中进行内容召回;然后根据人为限定的关键字的类别对embedding后的拼接数据进行权值赋值,再与所召回的内容进行相似度比对,选出最优召回;
7、将每一个测评点根据最优召回,通过正则表达式判定出风险值;再将所得的测评点的风险值和与当前测评点自身的top20特征相关的测评点的风险值输入到风险值微调模型中,根据风险值进行高低的分类,并将所得结果输出。
8、为优化上述技术方案,采取的具体措施还包括:
9、进一步地,所述指导文本为与密码应用高风险判定相关的内容文本。
10、进一步地,所述将导入的指导文本切割成数个文本块,具体步骤如下:通过正则表达式根据高风险项的测评点和测评项进行定位,然后再结合标题格式、特殊标识、语义的方法将导入的指导文本切割成数个文本块。
11、进一步地,所述将现场测评文档导入,具体包括如下步骤:将现场测评文档以表格的形式导入,表格的内容包括:测评项、测评点、测评级别和安全问题。
12、进一步地,所述提取现场测评文档中的所需信息形成初始query,具体包括如下步骤:将现场测评文档的非结构化数据转化为结构化数据,提取现场测评文档中的测评项、测评点、测评级别和安全问题的信息形成初始query。
13、进一步地,所述通过向量相似度算法从向量数据库中进行内容召回,具体包括如下步骤:通过向量相似度算法从向量数据库中进行内容召回,并召回topk个内容。
14、进一步地,所述根据人为限定的关键字的类别对embedding后的拼接数据进行权值赋值,再与所召回的内容进行相似度比对,具体包括如下步骤:然后根据测评项、测评点及人为限定的关键字的类别对embedding后的拼接数据进行权值赋值,再与topk个内容进行相似度比对。
15、进一步地,所述k=5。
16、进一步地,所述根据风险值进行高低的分类,具体包括如下步骤:分别根据预设阈值将风险值分为低风险项、中风险项和高风险项。
17、进一步地,一种计算机可读存储介质,存储有计算机程序,其特征在于:所述计算机程序使计算机执行如上述的一种商用密码应用安全性评估高风险项自动化判定方法。
18、本专利技术的有益效果是:
19、本专利技术通过结合自然语言处理技术和catboost树模型将高风险项判定工作改造为自动化流程,根据指导性文件建立向量数据库,通过专家数据库筛选关键字并对query进行拼接,随后采用加权向量相似度算法对向量数据库中的内容进行召回,对各测评点风险值进行初步判定。根据专家数据库针对每一个测评点搭建树模型从而对各测评点风险值进行微调。通过判定和微调两个子流程大幅度提高了高风险项判定的准确率。通过使用本专利所提出的方案,不但可以降低商用密码应用安全性评估中高风险项判定的技术门槛还可以提高整体工作效率。
本文档来自技高网...【技术保护点】
1.一种商用密码应用安全性评估高风险项自动化判定方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种商用密码应用安全性评估高风险项自动化判定方法,其特征在于,所述指导文本为与密码应用高风险判定相关的内容文本。
3.根据权利要求1所述的一种商用密码应用安全性评估高风险项自动化判定方法,其特征在于,所述将导入的指导文本切割成数个文本块,具体步骤如下:通过正则表达式根据高风险项的测评点和测评项进行定位,然后再结合标题格式、特殊标识、语义的方法将导入的指导文本切割成数个文本块。
4.根据权利要求1所述的一种商用密码应用安全性评估高风险项自动化判定方法,其特征在于,所述将现场测评文档导入,具体包括如下步骤:将现场测评文档以表格的形式导入,表格的内容包括:测评项、测评点、测评级别和安全问题。
5.根据权利要求1所述的一种商用密码应用安全性评估高风险项自动化判定方法,其特征在于,所述提取现场测评文档中的所需信息形成初始query,具体包括如下步骤:将现场测评文档的非结构化数据转化为结构化数据,提取现场测评文档中的测评项、测评点、测评级别
6.根据权利要求1所述的一种商用密码应用安全性评估高风险项自动化判定方法,其特征在于,所述通过向量相似度算法从向量数据库中进行内容召回,具体包括如下步骤:通过向量相似度算法从向量数据库中进行内容召回,并召回TOPK个内容。
7.根据权利要求6所述的一种商用密码应用安全性评估高风险项自动化判定方法,其特征在于,所述根据人为限定的关键字的类别对embedding后的拼接数据进行权值赋值,再与所召回的内容进行相似度比对,具体包括如下步骤:然后根据测评项、测评点及人为限定的关键字的类别对embedding后的拼接数据进行权值赋值,再与TOPK个内容进行相似度比对。
8.根据权利要求6所述的一种商用密码应用安全性评估高风险项自动化判定方法,其特征在于:所述K=5。
9.根据权利要求1所述的一种商用密码应用安全性评估高风险项自动化判定方法,其特征在于,所述根据风险值进行高低的分类,具体包括如下步骤:分别根据预设阈值将风险值分为低风险项、中风险项和高风险项。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序使计算机执行如权利要求1-9任一项所述的一种商用密码应用安全性评估高风险项自动化判定方法。
...【技术特征摘要】
1.一种商用密码应用安全性评估高风险项自动化判定方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种商用密码应用安全性评估高风险项自动化判定方法,其特征在于,所述指导文本为与密码应用高风险判定相关的内容文本。
3.根据权利要求1所述的一种商用密码应用安全性评估高风险项自动化判定方法,其特征在于,所述将导入的指导文本切割成数个文本块,具体步骤如下:通过正则表达式根据高风险项的测评点和测评项进行定位,然后再结合标题格式、特殊标识、语义的方法将导入的指导文本切割成数个文本块。
4.根据权利要求1所述的一种商用密码应用安全性评估高风险项自动化判定方法,其特征在于,所述将现场测评文档导入,具体包括如下步骤:将现场测评文档以表格的形式导入,表格的内容包括:测评项、测评点、测评级别和安全问题。
5.根据权利要求1所述的一种商用密码应用安全性评估高风险项自动化判定方法,其特征在于,所述提取现场测评文档中的所需信息形成初始query,具体包括如下步骤:将现场测评文档的非结构化数据转化为结构化数据,提取现场测评文档中的测评项、测评点、测评级别和安全问题的信息形成初始query。
6.根据权利要...
【专利技术属性】
技术研发人员:刘钰,王建峰,孟成瑞,
申请(专利权)人:中电信数智科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。