【技术实现步骤摘要】
本专利技术涉及文档内容检测领域,特别涉及一种大语言模型的文档数据分析方法、装置、设备及介质。
技术介绍
1、随着信息时代的迅猛发展,社会各领域对智能终端及互联网的依赖程度持续加深,互联网空间内数据资源的流动规模与速度均呈现指数级增长。数据分类分级作为数据安全管理体系的核心环节,能够从源头上系统梳理并规范管理数据资产,科学界定数据价值属性与风险等级,为后续构建多层次安全防护体系提供理论依据和实践指引。
2、如何结合业务场景、合规要求及风险特征,实现数据的智能分类与动态分级,突破人工依赖的局限性,降低管理成本,同时支撑对敏感数据的精细化保护,为数据全生命周期的安全管控提供技术支撑,是适应数字化时代数据治理需求的重要创新方向。
3、当前数据分类分级技术主要依托关键词匹配、语义相似度计算及深度神经网络分类等方法,近年来虽涌现出基于大规模预训练语言模型的新型解决方案,但其实际应用仍面临显著的技术挑战。以企业商业秘密数据管理为例,企业的数据管理细则通常涵盖技术秘密、经营信息、客户数据、个人隐私等多维度的大量条款性内容,且需随
...【技术保护点】
1.一种基于大语言模型的文档数据分析方法,其特征在于,包括:
2.根据权利要求1所述的基于大语言模型的文档数据分析方法,其特征在于,所述预设层级配置文件建立方式为人工建立层级配置文件或自动建立层级配置文件;
3.根据权利要求1所述的基于大语言模型的文档数据分析方法,其特征在于,所述基于所述层级结构生成对应的目标层级配置文件之后,还包括:
4.根据权利要求1所述的基于大语言模型的文档数据分析方法,其特征在于,所述利用所述预设大语言模型对所述结构化输入数据进行预设多维度文本理解分析操作,以识别所述结构化输入数据中的层级结构,基于所述层级
...【技术特征摘要】
1.一种基于大语言模型的文档数据分析方法,其特征在于,包括:
2.根据权利要求1所述的基于大语言模型的文档数据分析方法,其特征在于,所述预设层级配置文件建立方式为人工建立层级配置文件或自动建立层级配置文件;
3.根据权利要求1所述的基于大语言模型的文档数据分析方法,其特征在于,所述基于所述层级结构生成对应的目标层级配置文件之后,还包括:
4.根据权利要求1所述的基于大语言模型的文档数据分析方法,其特征在于,所述利用所述预设大语言模型对所述结构化输入数据进行预设多维度文本理解分析操作,以识别所述结构化输入数据中的层级结构,基于所述层级结构生成对应的目标层级配置文件,包括:
5.根据权利要求1至4任一项所述的基于大语言模型的文档数据分析方法,其特征在于,所述利用所述预设大语言模型基于所述目标层级配置文件中的层级结构对所述待分析文档进行解析...
【专利技术属性】
技术研发人员:吴杰,贾佳,彭滢,燕立明,段成华,李龙,
申请(专利权)人:中电科网络安全科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。