一种基于实体的隐私政策和数据分析方法技术

技术编号:33945773 阅读:21 留言:0更新日期:2022-06-29 21:18
一种基于实体的隐私政策和数据分析方法是采集实体敏感的流到策略一致性数据来确定应用程序的隐私策略是否泄露了相关的数据流;所述一致性模型包括流到策略的一致性及流与隐私策略不一致。所述流到策略的一致性包括明确的披露和模糊的披露两种披露;流与隐私策略不一致包括省略披露、错误披露和二义性信息披露三中披露。有益效果在于:通过数据流隐私策略的分析确定数据流是否泄露,以及通过明确的策略一致性模型来判断数据流隐私策略,上述方式有效解决了现有数据信息泄露而无法准确判定的技术缺陷。该技术的应用有效保护隐私数据的同时提高了对应用状态的判定。的同时提高了对应用状态的判定。

【技术实现步骤摘要】
一种基于实体的隐私政策和数据分析方法


[0001]本专利技术涉及安全
,尤其是涉及一种基于实体的隐私政策和数据分析方法。

技术介绍

[0002]隐私保护是移动应用长期面临的一个开放性研究挑战。研究表明,移动应用程序中常常会发生设备标识符和地理位置等隐私敏感信息的泄露。广义上讲,隐私保护存在于技术、文化和法律三方面要素的交叉部分。如果在应用程序的隐私政策中披露该程序需要收集并共享数据,那么这些行为通常不会被认为是违规的。虽然已经有一些关于应用程序隐私策略的人工分析,但很难通过计算来自动化的推断出隐私策略的内容,以及应用程序如何遵守这些策略。
[0003]目前已经有研究者开始致力于通过研究帮助应用开发者编写准确的隐私政策,以及帮助应用商店识别侵犯隐私的行为,并帮助终端用户选择更加隐私友好的应用。从概念上讲,这些研究使用静态程序分析和自然语言处理相结合的方法来分析流程到政策的一致性。简单地说,流到策略的一致性分析决定了应用程序的行为是否与隐私政策中声明的一致。
[0004]此外,按照GDPR和CCPA等法律法规的规定,开发者需要披露与之共享信息的第三方实体。并且GDPR还要求厂商需要公开与之共享个人数据的数据接收第三方或接收方类别。在应用程序中,厂商(开发人员)被认为是数据的控制者,而第三方既可以是数据控制者,也可以是数据处理者(只对数据进行处理,而不进行存储等操作)。但是研究中涉及的大多数实体都将自己定位为数据控制者(如谷歌、Facebook和TapJoy)。
[0005]尽管目前的研究已经有一定的成果,但这些技术有一个共性的弱点:它们不能区分接收数据的实体(例如,应用程序本身和第三方的广告商和数据分析厂商)。
[0006]近年来,越来越多的人关注分析移动应用程序中流程到策略的不一致性。这些作品在如何分析应用程序行为流程和隐私政策方面有所不同。虽然之前的许多工作使用Android的应用程序接口(application program interface, API)调用来评估隐私侵犯。策略分析方面,有相关工作采用基于关键字的方法,分别使用双字格和动词修正词来推断隐私策略,以及使用众包本体进行策略分析。其他最近的研究集中于分析特定的应用类别,例如那些为家庭设计的应用,合规性和隐私侵犯。他们使用动态分析来识别敏感的流以及接收数据的实体。然而,他们的策略分析要么是手动的,要么是基于关键词搜索的半自动策略分析。虽然这些方法可能适用于具有明确要求的应用类别,但它们在精确度和规模上严重限制了工作效率。

技术实现思路

[0007]本专利技术针对现有技术的不足,提出了一种基于实体的隐私政策和数据分析方法,其提供了一个实体敏感的流到策略一致性模型来确定应用程序的隐私策略是否泄露了相
关的数据流,有效提供了现有的工作效率。
[0008]一种基于实体的隐私政策和数据分析方法是采集实体敏感的流到策略一致性数据来确定应用程序的隐私策略是否泄露了相关的数据流;所述一致性模型包括流到策略的一致性及流与隐私策略不一致。
[0009]优选的,所述流到策略的一致性包括明确的披露和模糊的披露两种披露;其中,当隐私策略中直接明确标注了数据流的类型和共享数据的实体,且没有与之相矛盾的其他策略声明时,该数据流可以被定义为明确披露;当隐私策略中,与数据流有关的表述使用了数据类型或实体的广义术语时,数据流将被定义为模糊披露;同时与明确披露类似之处在于,只有在不存在相互矛盾的政策声明时,声明才属于模糊披露。
[0010]优选的,流与隐私策略不一致包括省略披露、错误披露和二义性信息披露三中披露;其中,如果没有策略声明对数据流进行讨论,则数据流符合省略披露;如果隐私策略指出共享数据的情况不会发生,那么当该应用共享数据时,就可以将该应用定义为错误披露;如果数据流与两个或多个相互矛盾的策略语句相匹配,且不清楚该流是否会发生,则数据流被定义为二义性披露。
[0011]本专利技术所述技术方案的有益效果在于:通过数据流隐私策略的分析确定数据流是否泄露,以及通过明确的策略一致性模型来判断数据流隐私策略,上述方式有效解决了现有数据信息泄露而无法准确判定的技术缺陷。该技术的应用有效保护隐私数据的同时提高了对应用状态的判定。
具体实施方式
[0012]为了使本领域技术人员更好地理解本专利技术的技术方案,下面结合具体实施例对本专利技术作进一步的详细说明。
[0013]一种基于实体的隐私政策和数据分析方法是采集实体敏感的流到策略一致性数据来确定应用程序的隐私策略是否泄露了相关的数据流;所述一致性模型包括流到策略的一致性及流与隐私策略不一致。
[0014]优选的,所述流到策略的一致性包括明确的披露和模糊的披露两种披露;其中,当隐私策略中直接明确标注了数据流的类型和共享数据的实体,且没有与之相矛盾的其他策略声明时,该数据流可以被定义为明确披露;当隐私策略中,与数据流有关的表述使用了数据类型或实体的广义术语时,数据流将被定义为模糊披露;同时与明确披露类似之处在于,只有在不存在相互矛盾的政策声明时,声明才属于模糊披露。
[0015]优选的,流与隐私策略不一致包括省略披露、错误披露和二义性信息披露三中披露;其中,如果没有策略声明对数据流进行讨论,则数据流符合省略披露;如果隐私策略指出共享数据的情况不会发生,那么当该应用共享数据时,就可以将该应用定义为错误披露;
如果数据流与两个或多个相互矛盾的策略语句相匹配,且不清楚该流是否会发生,则数据流被定义为二义性披露。
[0016]利用本专利技术所述技术方案对13796个应用程序及其隐私策略进行了研究,发现42.4%的应用程序没有正确地公开或隐藏其隐私敏感的数据流。根据研究结果,证实了考虑接收实体的重要性:如果不考虑接收实体这一因素,传统技术方案会将多达38.4%的应用程序错误的划分为有可能发生隐私泄漏的应用程序,但是实际上这些数据流与应用本身的隐私策略是一致的。本技术方案通过对一个实体敏感的流到策略的一致性分析,并提供了迄今为止最精确的方法来确定应用程序是否正确地公开了其敏感的隐私数据收集行为。
[0017]以上对本专利技术所提供的一种基于实体的隐私政策和数据分析方法进行了详细介绍,本文中应用了实施例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于实体的隐私政策和数据分析方法,其特征在于:所述基于实体的隐私政策和数据分析方法是采集实体敏感的流到策略一致性数据来确定应用程序的隐私策略是否泄露了相关的数据流;所述一致性模型包括流到策略的一致性及流与隐私策略不一致。2.如权利要求1所述的一种基于实体的隐私政策和数据分析方法,其特征在于:所述流到策略的一致性包括明确的披露和模糊的披露两种披露;其中,当隐私策略中直接明确标注了数据流的类型和共享数据的实体,且没有与之相矛盾的其他策略声明时,该数据流可以被定义为明确披露;当隐私策略中,与数据流有关的表述使用了数据类型或实...

【专利技术属性】
技术研发人员:胡建勋闫伟刘元
申请(专利权)人:中科信息安全共性技术国家工程研究中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1