基于大模型的文件安全定级方法、系统、设备及存储介质技术方案

技术编号：40789046 阅读：2 留言：0更新日期：2024-03-28 19:19

本发明专利技术涉及信息安全技术领域，提供一种基于大模型的文件安全定级方法、系统、设备及存储介质，该方法包括：获取待定级文件；将待定级文件输入至预训练的大模型，由大模型对待定级文件进行语义分析，得到语义分析结果；语义分析结果与预设文件安全等级对应；根据语义分析结果对待定级文件进行定级。本发明专利技术能够充分利用大模型的学习和分析能力，自动对待定级文件进行安全定级，可以提高文件安全管理的效率和准确性，为各种行业和组织提供更可靠的文件安全保护。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及信息安全，尤其涉及一种基于大模型的文件安全定级方法、系统、设备及存储介质。

技术介绍

1、随着大数据、云计算、移动互联、互联网+等新兴技术及应用的迅速发展，大规模数据的产生和共享，保护敏感数据的安全性变得尤为关键。文件安全定级是信息安全领域的一个重要问题，它涉及对文件进行分类、评估和管理，以确保其在存储、传输和处理过程中的安全性。

2、传统的文件安全定级方法主要基于人工手动标记方法，利用数据分析师的主观意识判断是否为敏感数据，其识别效率低，在面对大量数据的时候，人工手动标记需要大量的人力和时间，而且对处理人员的专业素质要求较高；且评判标准不统一，由于敏感数据识别过程主要依赖与人的主观判断，不同的人对相同的数据可能会出现不同的评判标准，甚至同一个人在不同时间所识别的结果仍有不同，这就会导致敏感数据识别结果的差异性，容易出现标记不一致的情况。

技术实现思路

1、本专利技术提供一种基于大模型的文件安全定级方法、系统、设备及存储介质，用以解决现有技术中通过人工手动标记的方式进行文件安全定级需要大量的人力和时间且标记易出现不一致的缺陷。本专利技术能够充分利用大模型的学习和分析能力，自动对待定级文件进行安全定级，可以提高文件安全管理的效率和准确性，为各种行业和组织提供更可靠的文件安全保护。

2、本专利技术提供一种基于大模型的文件安全定级方法，包括：获取待定级文件；将所述待定级文件输入至预训练的大模型，由所述大模型对所述待定级文件进行语义分析，得到语义分析结

3、根据本专利技术提供的一种基于大模型的文件安全定级方法，还包括：获取训练样本文件；根据所述训练样本文件对所述大模型进行训练，以提取所述训练样本文件的安全特征，所述安全特征与所述预设文件安全等级对应。

4、根据本专利技术提供的一种基于大模型的文件安全定级方法，所述将所述待定级文件输入至预训练的大模型之前，还包括：将所述待定级文件进行分片处理，得到多个文档片段，以将多个所述文档片段输入至预训练的所述大模型。

5、根据本专利技术提供的一种基于大模型的文件安全定级方法，所述获取待定级文件，包括：确定待定级文件的来源和类型；根据所述待定级文件的来源和类型获取所述待定级文件的内容和属性。

6、根据本专利技术提供的一种基于大模型的文件安全定级方法，还包括：将所述待定级文件进行向量化操作，得到向量化文件；根据所述向量化文件对所述大模型进行微调。

7、根据本专利技术提供的一种基于大模型的文件安全定级方法，所述向量化文件持久化存储在向量数据库中。

8、根据本专利技术提供的一种基于大模型的文件安全定级方法，所述大模型为chatglm-6b模型。

9、本专利技术还提供一种基于大模型的文件安全定级系统，包括：获取模块，用于获取待定级文件；分析模块，用于将所述待定级文件输入至预训练的大模型，由所述大模型对所述待定级文件进行语义分析，得到语义分析结果；所述语义分析结果与预设文件安全等级对应；定级模块，用于根据所述语义分析结果对所述待定级文件进行定级。

10、本专利技术还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述基于大模型的文件安全定级方法。

11、本专利技术还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述基于大模型的文件安全定级方法。

12、本专利技术提供的一种基于大模型的文件安全定级方法、系统、设备及存储介质，该方法包括：获取待定级文件；将待定级文件输入至预训练的大模型，由大模型对待定级文件进行语义分析，得到语义分析结果；语义分析结果与预设文件安全等级对应；根据语义分析结果对待定级文件进行定级。本专利技术能够充分利用大模型的学习和分析能力，自动对待定级文件进行安全定级，可以提高文件安全管理的效率和准确性，为各种行业和组织提供更可靠的文件安全保护。

本文档来自技高网...

【技术保护点】

1.一种基于大模型的文件安全定级方法，其特征在于，包括：

2.根据权利要求1所述的基于大模型的文件安全定级方法，其特征在于，还包括：

3.根据权利要求1所述的基于大模型的文件安全定级方法，其特征在于，所述将所述待定级文件输入至预训练的大模型之前，还包括：

4.根据权利要求1所述的基于大模型的文件安全定级方法，其特征在于，所述获取待定级文件，包括：

5.根据权利要求1所述的基于大模型的文件安全定级方法，其特征在于，还包括：

6.根据权利要求5所述的基于大模型的文件安全定级方法，其特征在于，所述向量化文件持久化存储在向量数据库中。

7.根据权利要求1至6任一项所述的基于大模型的文件安全定级方法，其特征在于，所述大模型为ChatGLM-6B模型。

8.一种基于大模型的文件安全定级系统，其特征在于，包括：

9.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至7任一项所述基于大模型的文件安全定级方法。</p>

10.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于大模型的文件安全定级方法。

...

【技术特征摘要】

1.一种基于大模型的文件安全定级方法，其特征在于，包括：

2.根据权利要求1所述的基于大模型的文件安全定级方法，其特征在于，还包括：

3.根据权利要求1所述的基于大模型的文件安全定级方法，其特征在于，所述将所述待定级文件输入至预训练的大模型之前，还包括：

4.根据权利要求1所述的基于大模型的文件安全定级方法，其特征在于，所述获取待定级文件，包括：

5.根据权利要求1所述的基于大模型的文件安全定级方法，其特征在于，还包括：

6.根据权利要求5所述的基于大模型的文件安全定级方法，其特征在于，所述向量化文件持久化存储在向量...

【专利技术属性】
技术研发人员：宋秉徽，王云峰，苑高龙，
申请(专利权)人：北京汉勃科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人