一种隐私政策文档中伪模糊检测方法技术

技术编号:31085936 阅读:45 留言:0更新日期:2021-12-01 12:38
本发明专利技术公开了一种隐私政策文档中伪模糊检测方法,所述方法包括:获取隐私政策样本集,并基于扎根理论对所述隐私政策样本集中支撑语句的支撑模式进行总结归类,以构建伪模糊检测模型;基于深度神经网络模型的模糊检测算法,获取待检测隐私政策文档的模糊语句;基于所述模糊语句和所述待检测隐私政策文档,根据所述伪模糊检测模型,对每个所述模糊语句进行潜在伪模糊判定,以识别潜在伪模糊语句。本发明专利技术增加了对模糊语句的二次检测,可筛除第一次检测中出现的错误结果,提高了检测的准确性。提高了检测的准确性。提高了检测的准确性。

【技术实现步骤摘要】
一种隐私政策文档中伪模糊检测方法


[0001]本专利技术涉及信息技术处理领域,尤其涉及一种隐私政策文档中伪模糊检测方法。

技术介绍

[0002]近年来,个人与国家都越来越重视用户的隐私问题。隐私政策作为企业与用户之间有约束力的协议,是用户问责和法律监管的依据,必须确保其描述准确无二义。而大量的企业案例以及学术研究证明,隐私政策中存在大量的模糊之处。
[0003]现有的研究只关注到隐私政策中的模糊词语或者孤立语句,而没有考虑隐私政策中上下文之间的关联。这将导致模糊性检测不够准确,部分检测到的模糊性在隐私政策上下文中存在着对其进行解释支撑的内容。

技术实现思路

[0004]本专利技术实施例提供一种隐私政策文档中伪模糊检测方法,用以解决现有技术检测过程中未考虑隐私政策上下的关联导致模糊性检测不够准确问题。
[0005]根据本专利技术实施例的隐私政策文档中伪模糊检测方法,包括:
[0006]获取隐私政策样本集,并基于扎根理论对所述隐私政策样本集中支撑语句的支撑模式进行总结归类,以构建伪模糊检测模型;
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种隐私政策文档中伪模糊检测方法,其特征在于,包括:获取隐私政策样本集,并基于扎根理论对所述隐私政策样本集中支撑语句的支撑模式进行总结归类,以构建伪模糊检测模型;基于深度神经网络模型的模糊检测算法,获取待检测隐私政策文档的模糊语句;基于所述模糊语句和所述待检测隐私政策文档,根据所述伪模糊检测模型,对每个所述模糊语句进行潜在伪模糊判定,以识别潜在伪模糊语句。2.如权利要求1所述的方法,其特征在于,所述基于扎根理论对所述隐私政策样本集中支撑语句的支撑模式进行总结归类,以构建伪模糊检测模型,包括:对所述隐私政策样本集中每个所述隐私政策文档的模糊词进行标注,并确定具有模糊词的模糊语句的模糊程度;判断模糊程度大于阈值的模糊语句在对应的隐私政策文档中是否具有支撑语句,以识别出潜在伪模糊语句;分析所述潜在伪模糊语句与其支撑语句的特征和关联关系,以对支撑语句的支撑模式进行归类,并确定各个支撑模式的识别算法,以构建伪模糊检测模型。3.如权利要求2所述的方法,其特征在于,所述支撑模式包括:补充支撑模式;对于所述补充支撑模式,设计基于关键词匹配和段落结构匹配的识别算法。4.如权利要求3所述的方法,其特征在于,所述基于所述模糊语句和所述待检测隐私政策文档,根据所述伪模糊检测模型,对每个所述模糊语句进行潜在伪模糊判定,以识别潜在伪模糊语句,包括:对所述待检测隐私政策文档进行分句分段;对分句分段后的待检测隐私政策文档进行不完整语句识别,以识别出起始语句和枚举项语句;将所述模糊语句与所述起始语句和枚举项语句进行相似性检测,输出相似性检测结果大于第一设定值的模糊语句为潜在伪模糊语句。5.如权利要求2所述的方法,其特征在于,所述支撑模式包括:举例支撑模式;对于所述举例支撑模...

【专利技术属性】
技术研发人员:连小利吕鹤阳黄丹张莉
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1