System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据处理,具体涉及一种基于机器学习的辅助定密方法及系统。
技术介绍
1、随着经济和科学技术的飞速发展,数据的价值也随之增长。随之而来的就是数据文件的安全问题,目前,通过对数据进行准确的密级标识,可以大幅度的提高数据保密的工作效率和保证数据安全。
2、然而,对于梳理核心文件,确定保密范围以及保密等级往往还是依靠人工确定的方式,不仅定密效率低,而且随着文件的逐步积累,数据量的增多,定密的准确性也不能够满足要求。现有技术中定密准确性差,智能化程度低的技术问题。
技术实现思路
1、本申请提供了一种基于机器学习的辅助定密方法及系统,用于针对解决现有技术中定密准确性差,智能化程度低的技术问题。
2、鉴于上述问题,本申请提供了一种基于机器学习的辅助定密方法及系统。
3、本申请的第一个方面,提供了一种基于机器学习的辅助定密方法,所述方法包括:
4、获取待进行定密的目标文件的文件类型;
5、对所述目标文件进行文本预处理,获得包括多个关键词的目标关键词集合;
6、将所述多个关键词输入定密关键词数据库中进行索引,获得多个定密关键词,并计算获得所述多个定密关键词在所述目标关键词集合内的多个出现概率;
7、根据过去预设时间范围内的文件定密数据,基于机器学习,构建文件辅助定密分析模型,其中,所述文件辅助定密分析模型内包括多种样本文件类型对应的多个辅助定密模块;
8、根据所述文件类型,将所述多个出现概率
9、根据所述定密分析结果集合,获取目标定密等级,对所述目标文件进行辅助定密。
10、本申请的第二个方面,提供了一种基于机器学习的辅助定密系统,所述系统包括:
11、文件类型获取模块,所述文件类型获取模块用于获取待进行定密的目标文件的文件类型;
12、关键词获取模块,所述关键词获取模块用于对所述目标文件进行文本预处理,获得包括多个关键词的目标关键词集合;
13、出现概率计算模块,所述出现概率计算模块用于将所述多个关键词输入定密关键词数据库中进行索引,获得多个定密关键词,并计算获得所述多个定密关键词在所述目标关键词集合内的多个出现概率;
14、定密模型构建模块,所述定密模型构建模块用于根据过去预设时间范围内的文件定密数据,基于机器学习,构建文件辅助定密分析模型,其中,所述文件辅助定密分析模型内包括多种样本文件类型对应的多个辅助定密模块;
15、定密分析模块,所述定密分析模块用于根据所述文件类型,将所述多个出现概率输入对应的目标辅助定密模块内,获得定密分析结果集合,其中,每个辅助定密模块包括多个辅助定密单元;以及
16、辅助定密模块,所述辅助定密模块用于根据所述定密分析结果集合,获取目标定密等级,对所述目标文件进行辅助定密。
17、本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:
18、本申请通过获取待进行定密的目标文件的文件类型,然后对目标文件进行文本预处理,获得包括多个关键词的目标关键词集合,通过将多个关键词输入定密关键词数据库中进行索引,获得多个定密关键词,并计算获得多个定密关键词在目标关键词集合内的多个出现概率,然后根据过去预设时间范围内的文件定密数据,基于机器学习,构建文件辅助定密分析模型,其中,文件辅助定密分析模型内包括多种样本文件类型对应的多个辅助定密模块,进而根据文件类型,将多个出现概率输入对应的目标辅助定密模块内,获得定密分析结果集合,其中,每个辅助定密模块包括多个辅助定密单元,以及根据定密分析结果集合,获取目标定密等级,对目标文件进行辅助定密。达到了提高辅助定密准确性,提升定密效率和保证文件安全性的技术效果。
本文档来自技高网...【技术保护点】
1.一种基于机器学习的辅助定密方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,获取待进行定密的目标文件的文件类型,包括:
3.根据权利要求1所述的方法,其特征在于,将所述多个关键词输入定密关键词数据库中进行索引,获得多个定密关键词,并计算获得所述多个定密关键词在所述目标关键词集合内的多个出现概率,包括:
4.根据权利要求1样本所述的方法,其特征在于,根据过去预设时间范围内的文件定密数据,基于机器学习,构建文件辅助定密分析模型,包括:
5.根据权利要求4所述的方法,其特征在于,采用所述多个样本第一关键词出现概率集合和所述多个样本第一定密等级,构建所述第一样本文件类型对应的第一辅助定密模块,包括:
6.根据权利要求5所述的方法,其特征在于,采用所述第一构建数据集,构建所述第一辅助定密模块内的第一辅助定密单元,包括:
7.根据权利要求1所述的方法,其特征在于,根据所述定密分析结果集合,获取目标定密等级,包括:
8.一种基于机器学习的辅助定密系统,其特征在于,所述系统包括:
...【技术特征摘要】
1.一种基于机器学习的辅助定密方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,获取待进行定密的目标文件的文件类型,包括:
3.根据权利要求1所述的方法,其特征在于,将所述多个关键词输入定密关键词数据库中进行索引,获得多个定密关键词,并计算获得所述多个定密关键词在所述目标关键词集合内的多个出现概率,包括:
4.根据权利要求1样本所述的方法,其特征在于,根据过去预设时间范围内的文件定密数据,基于机器学习,构建文件辅助定密分析模型,包...
【专利技术属性】
技术研发人员:王杰辉,王光磊,范世杰,
申请(专利权)人:北京盛科沃科技发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。