一种大语言模型的文档数据分析方法、装置、设备及介质制造方法及图纸

技术编号:46432007 阅读:6 留言:0更新日期:2025-09-19 20:37
本申请公开了一种大语言模型的文档数据分析方法、装置、设备及介质,涉及实现数据的智能分类与动态分级,包括:确定预设数据管理细则文件,基于预设层级配置文件建立方式对预设数据管理细则文件进行预设层级配置操作,在配置结果中添加预设提示词,生成结构化输入数据;将结构化输入数据输入预设大语言模型,利用预设大语言模型对结构化输入数据进行预设多维度文本理解分析操作,识别层级结构,基于层级结构生成目标层级配置文件;将待分析文档和目标层级配置文件输入预设大语言模型,利用预设大语言模型基于目标层级配置文件中的层级结构对待分析文档进行解析,以得到目标分析结果及模型推理过程信息。本申请实现了数据的智能分类与动态分级。

【技术实现步骤摘要】

本专利技术涉及文档内容检测领域,特别涉及一种大语言模型的文档数据分析方法、装置、设备及介质


技术介绍

1、随着信息时代的迅猛发展,社会各领域对智能终端及互联网的依赖程度持续加深,互联网空间内数据资源的流动规模与速度均呈现指数级增长。数据分类分级作为数据安全管理体系的核心环节,能够从源头上系统梳理并规范管理数据资产,科学界定数据价值属性与风险等级,为后续构建多层次安全防护体系提供理论依据和实践指引。

2、如何结合业务场景、合规要求及风险特征,实现数据的智能分类与动态分级,突破人工依赖的局限性,降低管理成本,同时支撑对敏感数据的精细化保护,为数据全生命周期的安全管控提供技术支撑,是适应数字化时代数据治理需求的重要创新方向。

3、当前数据分类分级技术主要依托关键词匹配、语义相似度计算及深度神经网络分类等方法,近年来虽涌现出基于大规模预训练语言模型的新型解决方案,但其实际应用仍面临显著的技术挑战。以企业商业秘密数据管理为例,企业的数据管理细则通常涵盖技术秘密、经营信息、客户数据、个人隐私等多维度的大量条款性内容,且需随法规政策及企业战略调本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的文档数据分析方法,其特征在于,包括:

2.根据权利要求1所述的基于大语言模型的文档数据分析方法,其特征在于,所述预设层级配置文件建立方式为人工建立层级配置文件或自动建立层级配置文件;

3.根据权利要求1所述的基于大语言模型的文档数据分析方法,其特征在于,所述基于所述层级结构生成对应的目标层级配置文件之后,还包括:

4.根据权利要求1所述的基于大语言模型的文档数据分析方法,其特征在于,所述利用所述预设大语言模型对所述结构化输入数据进行预设多维度文本理解分析操作,以识别所述结构化输入数据中的层级结构,基于所述层级结构生成对应的目标层...

【技术特征摘要】

1.一种基于大语言模型的文档数据分析方法,其特征在于,包括:

2.根据权利要求1所述的基于大语言模型的文档数据分析方法,其特征在于,所述预设层级配置文件建立方式为人工建立层级配置文件或自动建立层级配置文件;

3.根据权利要求1所述的基于大语言模型的文档数据分析方法,其特征在于,所述基于所述层级结构生成对应的目标层级配置文件之后,还包括:

4.根据权利要求1所述的基于大语言模型的文档数据分析方法,其特征在于,所述利用所述预设大语言模型对所述结构化输入数据进行预设多维度文本理解分析操作,以识别所述结构化输入数据中的层级结构,基于所述层级结构生成对应的目标层级配置文件,包括:

5.根据权利要求1至4任一项所述的基于大语言模型的文档数据分析方法,其特征在于,所述利用所述预设大语言模型基于所述目标层级配置文件中的层级结构对所述待分析文档进行解析...

【专利技术属性】
技术研发人员:吴杰贾佳彭滢燕立明段成华李龙
申请(专利权)人:中电科网络安全科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1