一种基于NLP的数据收集合规识别方法技术

技术编号:41360606 阅读:47 留言:0更新日期:2024-05-20 10:10
本发明专利技术公开了一种基于NLP的数据收集合规识别方法,包括S1、构建La‑NLP模型,并对La‑NLP模型进行预训练;S2、调用经过预训练的La‑NLP模型对相关法律法规文本数据进行训练理解并生成合规要求;S3、获取待评估数据,使用基于La‑NLP模型对待评估数据进行处理,得到文本信息单元;S4、将文本信息单元生成的相应语义框架表示与合规要求的表示进行对齐,分析待评估数据的合规性;S5、根据分析结果评估数据合规,得到数据合规以及不合规部分的总结报告。本发明专利技术解决了现有技术存在的数据合规识别准确率低、效率低以及实用性低的问题。

【技术实现步骤摘要】

本专利技术涉及数据分析,尤其涉及一种基于nlp的数据收集合规识别方法。


技术介绍

1、数据合规是数据管理的基本保障,对数据资产的全生命周期管理起到基础性支持作用。然而,在数据合规的判断过程中,如果依靠人工检查给定的收集数据是否符合相关法律法规,需要花费大量的时间和精力。而且目前的数据合规体系还未建立完善,对于数据管理没有健全风险识别和预警机制,难以准确掌握生产经营中的合规风险。最后,实际业务中因行业、数据应用场景的不同,而且数据合规实务的合规依据更新较快,数据合规理论研究远远滞后于数据合规实务的发展。因此,如何提供一种基于nlp的数据收集合规识别方法是本领域技术人员亟需解决的问题。


技术实现思路

1、本专利技术的一个目的在于提出一种基于nlp的数据收集合规识别方法,本专利技术解决了现有技术存在的数据合规识别准确率低、效率低以及实用性低的问题。

2、根据本专利技术实施例的一种基于nlp的数据收集合规识别方法,包括如下方法步骤:

3、s1、构建la-nlp模型,并对la-nlp模型进行预训本文档来自技高网...

【技术保护点】

1.一种基于NLP的数据收集合规识别方法,其特征在于,包括如下方法步骤:

2.根据权利要求1所述的一种基于NLP的数据收集合规识别方法,其特征在于,所述La-NLP模型构建具体包括:

3.根据权利要求2所述的一种基于NLP的数据收集合规识别方法,其特征在于,所述La-NLP模型使用层次注意力机制划分文本中的每个法律条文的范围,将法律条文范围和规则库之间的对齐,视为最优传输问题,利用最优传输模块进行对法律条文范围和规则库之间的相互引导。

4.根据权利要求3所述的一种基于NLP的数据收集合规识别方法,其特征在于,所述S2具体包括:>

5.根据权利...

【技术特征摘要】

1.一种基于nlp的数据收集合规识别方法,其特征在于,包括如下方法步骤:

2.根据权利要求1所述的一种基于nlp的数据收集合规识别方法,其特征在于,所述la-nlp模型构建具体包括:

3.根据权利要求2所述的一种基于nlp的数据收集合规识别方法,其特征在于,所述la-nlp模型使用层次注意力机制划分文本中的每个法律条文的范围,将法律条文范围和规则库之间的对齐,视为最优传输问题,利用最优传输模块进行对法律条文范围和规则库之间的相互引导。

4.根据权利要求3所述的一种基于nlp的数据收集合规识别方法,其特征在于,所述s2具体包括:

5.根据权利要求4所述的一种基于nlp的数据收集合规识别方法,其特征在于,所述规则库中包括对于法律法规中的条款,将复合语句分解为简单要求,定义为第一规则库,对于行业报告中的合规要求,定义为第二规则库。

6.根据权利要求5所述的一种基于nlp的数据收集合规识别方法,其特征在于,所述强制性要求为有关数据控制者和处理者的身份隐私信息的关键信...

【专利技术属性】
技术研发人员:董士风林传文王佐成滕越吴光周田聪聪崔海鹰
申请(专利权)人:数据空间研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1