一种领域语言模型驱动的企业跨域数据风险分析方法及系统技术方案

技术编号:40821000 阅读:18 留言:0更新日期:2024-04-01 14:40
本发明专利技术公开了一种领域语言模型驱动的企业跨域数据风险分析方法及系统,方法包括:构建用于企业跨域数据风险分析的领域语言模型;基于领域语言模型驱动系统进行全景对话式企业跨域数据风险分析。其中构建领域语言模型包括:预处理企业跨域数据风险关联要素、日志、模型及相关运行脚本,形成领域语言模型的训练数据集;标注、切片训练数据集,以通用文本生成模型作为训练架构基础,搭建训练框架;交互式对话进行模型补充训练和调优。本发明专利技术可针对节点庞杂、链路发散、风险类型繁复的企业跨域数据交互进行全景交互式风险分析,从而快速识别数据风险、定位关联要素、分析风险诱因、监控风险源,提高企业跨域数据风险分析的全局响应及信息管控能力。

【技术实现步骤摘要】

本专利技术涉及数据安全,尤其涉及一种领域语言模型驱动的企业跨域数据风险分析方法及系统


技术介绍

1、在企业数据安全领域中,因跨域数据交互中角色、业务、系统、公私网络间权限管理、数据流管理缺陷所导致的安全问题尤为突出。然而,由于企业数据跨域节点庞杂、链路发散、风险类型繁复,单系统很难对全局数据流进行大范围、精细粒度的日志监控和风险分析,这导致企业在传统风险评估系统中难以快速识别数据风险、定位关联要素、分析风险诱因、监控风险源。在大语言模型技术日趋成熟和广泛应用的背景下,企业私有数据及风险分析相关专业知识亟需形成特定领域下的语言模型,从而可以实现对企业跨域数据的问答式分析,并对全局信息进行精准筛选、组织、以及管控。目前领域语言模型在企业数据安全中的应用包括异常行为检测、日志分析与威胁检测、数据访问监控、情报分析等。

2、在大语言模型研究概念中,常将模型区分为基座模型、指令微调模型、以及经过指令微调的有监督微调模型,后者具备与人类流畅对话的能力,如chatgpt、chatglm等。但在《domain specialization as the ke本文档来自技高网...

【技术保护点】

1.一种领域语言模型驱动的企业跨域数据风险分析方法,其特征在于,所述分析方法包括以下具体步骤:

2.根据权利要求1所述的一种领域语言模型驱动的企业跨域数据风险分析方法,其特征在于,所述企业跨域数据风险指企业跨不同系统域、角色域、业务域以及跨公私网域的数据交互风险。

3.根据权利要求1所述的一种领域语言模型驱动的企业跨域数据风险分析方法,其特征在于,所述领域语言包括但不限于与企业跨域数据风险分析相关的安全要素信息、风险属性、数据安全知识图谱、系统日志、风险量化分析模型、关键运行脚本;其中:

4.根据权利要求1所述的一种领域语言模型驱动的企业跨域数据风险分...

【技术特征摘要】

1.一种领域语言模型驱动的企业跨域数据风险分析方法,其特征在于,所述分析方法包括以下具体步骤:

2.根据权利要求1所述的一种领域语言模型驱动的企业跨域数据风险分析方法,其特征在于,所述企业跨域数据风险指企业跨不同系统域、角色域、业务域以及跨公私网域的数据交互风险。

3.根据权利要求1所述的一种领域语言模型驱动的企业跨域数据风险分析方法,其特征在于,所述领域语言包括但不限于与企业跨域数据风险分析相关的安全要素信息、风险属性、数据安全知识图谱、系统日志、风险量化分析模型、关键运行脚本;其中:

4.根据权利要求1所述的一种领域语言模型驱动的企业跨域数据风险分析方法,其特征在于,预处理训练数据集包括数据清洗、分词及标记文本、删除停用词、数据标注四步;其中:

5.根据权利要求1所述的一种领域语言模型驱动的企业跨域数据风险分析方法,其特征在于,所述通用文本生成模型指能够生成多种类型文本的广泛使用模型。

6.根据权利要求1所述的一种领域语言模型驱动的企业...

【专利技术属性】
技术研发人员:李威李健俊姜学峰姚广邵慧
申请(专利权)人:浙江中烟工业有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1