文本的隐私政策合规检测方法及系统技术方案

技术编号:42716246 阅读:27 留言:0更新日期:2024-09-13 12:05
本发明专利技术提供一种文本的隐私政策合规检测方法及系统,其中方法包括:基于自然语言处理模型,对待检测文本进行上下文语义信息提取,得到包含文本上下文语义信息的特征向量;将特征向量输入神经网络文本分类模型,得到神经网络文本分类模型输出的分类结果。本发明专利技术提供的文本的隐私政策合规检测方法及系统,通过自然语言处理模型结合神经网络文本分类模型,可捕捉到待检测文本的上下文信息,具有更优异的学习能力与表达能力,以有效提取待检测文本的特征数据,精准实现了待检测文本的多标签自动化分类。将构建的文本分类模型与隐私政策数据集中凝练总结的隐私政策合规规则结合,高效精准地实现了隐私政策的自动化合规检测。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其涉及一种文本的隐私政策合规检测方法及系统


技术介绍

1、隐私政策是企业的在线服务或应用程序向个人用户提供在线通知和选择的最常见方式之一,也是向个人用户披露数据实践的主要手段。其旨在告知企业如何收集、处理、共享和保护用户的个人信息。由于隐私政策属于法律性质的文件,所以其通常充斥着大量的法律术语。这些术语不仅专业性强,它们构成的语句也往往冗长且错综复杂。

2、现有的基于对隐私政策的合规检测一般是基于但往往因为法律术语问题导致标注任务的专业性不强,且效果不佳;另一些则是使用多种自然语言处理和其他技术融合,例如文本匹配等方式实现,实现难度与复杂度大,不具有良好的实用性。如何高效准确的实现隐私政策的合规检测的需求是目前业界亟待解决的重要课题。


技术实现思路

1、

2、本专利技术提供一种文本的隐私政策合规检测方法及系统,用以实现高效准确的实现隐私政策的合规检测。

3、本专利技术提供一种文本的隐私政策合规检测方法,包括如下步骤:

<p>4、获取待检测文本文档来自技高网...

【技术保护点】

1.一种文本的隐私政策合规检测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的文本的隐私政策合规检测方法,其特征在于,所述基于自然语言处理模型,对所述待检测文本进行上下文语义信息提取,得到所述自然语言处理模型输出的包含文本上下文语义信息的特征向量,包括:

3.根据权利要求1或2所述的文本的隐私政策合规检测方法,其特征在于,所述自然语言处理模型是基于对RoBERTa模型的最大截断输入长度以及学习率进行调整后构建的;

4.根据权利要求1所述的文本的隐私政策合规检测方法,其特征在于,所述神经网络文本分类模型是基于改进后的胶囊网络确定的;

...

【技术特征摘要】

1.一种文本的隐私政策合规检测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的文本的隐私政策合规检测方法,其特征在于,所述基于自然语言处理模型,对所述待检测文本进行上下文语义信息提取,得到所述自然语言处理模型输出的包含文本上下文语义信息的特征向量,包括:

3.根据权利要求1或2所述的文本的隐私政策合规检测方法,其特征在于,所述自然语言处理模型是基于对roberta模型的最大截断输入长度以及学习率进行调整后构建的;

4.根据权利要求1所述的文本的隐私政策合规检测方法,其特征在于,所述神经网络文本分类模型是基于改进后的胶囊网络确定的;

5.根据权利要求4所述的文本的隐私政策合规检测方法,其特征在于,所述将所述特征向量输入神经网络文本分类模型,得到所述神经...

【专利技术属性】
技术研发人员:牛犇李铂浩侯雨桥李凤华
申请(专利权)人:中国科学院信息工程研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1