一种基于大模型的政务数据自动分类分级方法技术

技术编号：41208432 阅读：2 留言：0更新日期：2024-05-09 23:30

本发明专利技术公开了一种基于大模型的政务数据自动分类分级方法，定义好数据分类分级的规则，通过大模型对数据分类分级的规则定义进行学习，再通过大模型对输入数据进行分析与理解，判别输入数据所符合的分类分级规则特征，联合数据类别、数据敏感等级与分类分级规则特征的对应关系，得出数据的分类分级结果。本发明专利技术解决目前的数据分类分级方法大多是人工定制化服务，人工成本较高且效率低下；或者通过固定数据与分类分级结果的映射规则，以匹配数据关键字来进行分类分级，因缺乏语义理解导致匹配范围较小，固定数据与分类分级结果导致脱离数据实际应用场景，二次修改率较高等问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及大数据及数据资产关管理的，特别是一种基于大模型的政务数据自动分类分级方法。

技术介绍

1、在政务大数据的发展背景下，各地区、各部门按照国家要求的数据分类分级保护制度，对政务领域的数据进行分类分级管理。

2、现有的政务数据分类分级方式基本依赖人工手动分类分级，或通过预置数据与分类分级结果的映射规则，来实现数据分类分级。纯人工数据分类分级的方式存在效率低下、效果及其依赖实施人员经验等问题；而使用预置数据与分类分级结果映射规则进行分类分级，虽然可以通过信息化系统自动匹配规则结果，一定程度提升工作效率，但是只能通过关键字匹配，匹配成功率低，且因为同一数据的安全等级并不是固定不变的，所该方法也存在大量的分类分级结果核实及修改工作量成本。

技术实现思路

1、针对现有技术中存在的问题，本专利技术提供了一种成本低且效率高、二次修改率低的基于大模型的政务数据自动分类分级方法。

2、本专利技术的目的通过以下技术方案实现。

3、相比于现有技术，本专利技术的优点在于：（1）基于大语言模型智能化、自动化的技术特点，在提高自动分类分级的数据覆盖范围的同时，还具备更高的准确度及效率。

4、（2）基于大模型自然语言语义理解的技术特点，可以根据数据的数据目录信息、使用场景描述等业务元数据的变化实现数据分类分级的动态变更。

5、（3）基于大模型强化学习的技术特点，可以根据每次数据自动分类分级的结果与人工确认结果的人机交互过程，持续自训练提升数据分类分级的精准度。

本文档来自技高网...

【技术保护点】

1.一种基于大模型的政务数据自动分类分级方法，其特征在于步骤包括：

2.根据权利要求1所述的一种基于大模型的政务数据自动分类分级方法，其特征在于所述步骤S2包括：定义数据分类的依据，分类维度，类目名称；定义数据分级的依据，数据敏感等级与描述，分级规则与方法。

3.根据权利要求1所述的一种基于大模型的政务数据自动分类分级方法，其特征在于所述步骤S3具体为：部署预训练大语言模型；向预训练大语言模型中导入政务领域知识库，对政务领域知识进行学习，构建政务领域大语言模型。

4.根据权利要求1所述的一种基于大模型的政务数据自动分类分级方法，其特征在于所述步骤S4具体为：

5.根据权利要求1所述的一种基于大模型的政务数据自动分类分级方法，其特征在于所述步骤S5具体为：

6.根据权利要求1所述的一种基于大模型的政务数据自动分类分级方法，其特征在于所述步骤S6具体为：

【技术特征摘要】

1.一种基于大模型的政务数据自动分类分级方法，其特征在于步骤包括：

2.根据权利要求1所述的一种基于大模型的政务数据自动分类分级方法，其特征在于所述步骤s2包括：定义数据分类的依据，分类维度，类目名称；定义数据分级的依据，数据敏感等级与描述，分级规则与方法。

3.根据权利要求1所述的一种基于大模型的政务数据自动分类分级方法，其特征在于所述步骤s3具体为：部署预训练大语言模型；向预训练...

【专利技术属性】
技术研发人员：胡强，
申请(专利权)人：江苏数兑科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人