文本定密方法及装置、非易失性存储介质、处理器制造方法及图纸

技术编号：34641994 阅读：11 留言：0更新日期：2022-08-24 15:17

本申请公开了一种文本定密方法及装置、非易失性存储介质、处理器。其中，该方法包括：获取待分类文本集合；确定待分类文本集合中各待分类文本的特征向量；将各待分类文本的特征向量输入至涉密等级分类模型进行处理，确定各待分类文本的涉密等级，其中，涉密等级分类模型是对各待分类文本的特征向量形成的特征向量空间进行训练得到的。本申请解决了由于无法对文本进行合理精准分类造成的文本定密效率较低与文本定密精确度较差的技术问题。低与文本定密精确度较差的技术问题。低与文本定密精确度较差的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
文本定密方法及装置、非易失性存储介质、处理器

[0001]本申请涉及网络信息安全领域，具体而言，涉及一种文本定密方法及装置、非易失性存储介质、处理器。

技术介绍

[0002]随着计算机网络等技术的高速发展，许多企业信息化建设不断推进，大量应用了信息处理、交流、存储和管理等软件，规范了操作流程和工作方式提高工作效率，却带来了信息泄露风险。因此，保密工作成为关键环节，保密工作中最关键的一点就是对确定涉密文本的秘密等级。相关技术中，确定文本秘密等级的算法技术依然存在定密效率低、定密精准度差的问题。
[0003]针对上述的问题，目前尚未提出有效的解决方案。

技术实现思路

[0004]本申请实施例提供了一种文本定密方法及装置、非易失性存储介质、处理器，以至少解决由于无法对文本进行合理精准分类造成的文本定密效率较低与文本定密精确度较差的技术问题。
[0005]根据本申请实施例的一个方面，提供了一种文本定密方法，包括：获取待分类文本集合；确定待分类文本集合中各待分类文本的特征向量；将各待分类文本的特征向量输入至涉密等级分类模型进行处理，确定各待分类文本的涉密等级，其中，涉密等级分类模型是对各待分类文本的特征向量形成的特征向量空间进行训练得到的。
[0006]可选地，确定待分类文本集合中各待分类文本的特征向量，包括：对各待分类文本进行预处理，得到各待分类文本对应的原始特征；对各待分类文本对应的原始特征进行处理，得到各待分类文本对应的概念特征；分别计算各待分类文本对应的概念特征的卡方值，得到各待...

【技术保护点】

【技术特征摘要】
1.一种文本定密方法，其特征在于，包括：获取待分类文本集合；确定所述待分类文本集合中各待分类文本的特征向量；将所述各待分类文本的特征向量输入至涉密等级分类模型进行处理，确定所述各待分类文本的涉密等级，其中，所述涉密等级分类模型是对所述各待分类文本的特征向量形成的特征向量空间进行训练得到的。2.根据权利要求1所述的方法，其特征在于，确定所述待分类文本集合中各待分类文本的特征向量，包括：对所述各待分类文本进行预处理，得到所述各待分类文本对应的原始特征；对所述各待分类文本对应的原始特征进行处理，得到所述各待分类文本对应的概念特征；分别计算所述各待分类文本对应的概念特征的卡方值，得到所述各待分类文本对应的目标特征集合；计算所述目标特征集合中各特征的权重，得到所述各待分类文本对应的特征向量，其中，所述特征向量用于表示所述待分类文本。3.根据权利要求2所述的方法，其特征在于，分别计算所述各待分类文本对应的概念特征的卡方值，得到所述各待分类文本对应的目标特征集合，包括：对所述各待分类文本对应的概念特征的卡方值进行降序排列，得到所述各待分类文本对应的概念特征的卡方值序列；将所述卡方值序列中前N个卡方值对应的所述概念特征确定为所述目标特征集合，其中，N为大于0的自然数。4.根据权利要求1所述的方法，其特征在于，将所述各待分类文本的特征向量输入至涉密等级分类模型进行处理之前，所述方法还包括：对所述各待分类文本的特征向量进行计算，得到所述特征向量空间；将所述特征向量空间输入支持向量机进行训练，得到所述涉密等级分类模型。5.根据权利要求2所述的方法，其特征在于，包括：对所述各待分类文本进行预处...

【专利技术属性】
技术研发人员：王乾，赵轶新，蒋艳军，孙科，
申请(专利权)人：中国电信股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人