【技术实现步骤摘要】
面向隐私保护政策的APP隐私数据一致性行为分析方法
本专利技术涉及移动应用程序中的隐私政策分析领域,特别涉及一种隐私政策完整性分析和应用程序行为一致性的判别方法。
技术介绍
近年来,我国移动APP行业持续向前发展。据相关数据显示,在2019年里,我国移动网民人均安装app总量持续增长至60款,用户在2021年预计达到5亿人。随着移动应用市场的不断扩大,应用软件越来越复杂,用户数据越来越不安全,应用要权和越权行为越来越多。为了保护用户数据的安全性,国家规定移动应用需要有专门的隐私政策条例,描述应用在使用过程中涉及到用户隐私的权限,只有用户同意后应用才可以收集和使用用户的数据。然而目前的安全分析技术主要关注在应用本身的数据使用情况上,将隐私政策与软件行为相结合的分析寥寥无几。移动应用的隐私政策与安全分析主要存在以下问题:1)隐私政策编写不规范,对于指定分类的移动应用,无法达到相关标准涵盖的全部内容,也就是隐私政策不完整,存在缺项漏项的现象;2)隐私政策的编写与软件的实际行为存在差异,这可能是隐私政 ...
【技术保护点】
1.面向隐私保护政策的APP隐私数据一致性行为分析方法,其特征在于,包括如下步骤:/n1)基于文本分类的隐私政策完整性检测:/n步骤S101:对于待检测软件S及其所属类的数据集D,获得它们的隐私政策,去除非文字内容部分后,将每个句子根据单词的组成情况转化为特征向量;/n步骤S102:根据步骤S101将数据集D中的隐私政策转化为特征向量,对每个句子根据隐私政策规范指定的不同类型进行分类,然后使用机器学习方法,构建不同的分类器;/n步骤S103:根据步骤S102得到的分类器,对待检测软件S的隐私政策P分类,若P中拥有的类型不包含指定的全部类型,则判定隐私政策P不完整;/n2)基 ...
【技术特征摘要】
1.面向隐私保护政策的APP隐私数据一致性行为分析方法,其特征在于,包括如下步骤:
1)基于文本分类的隐私政策完整性检测:
步骤S101:对于待检测软件S及其所属类的数据集D,获得它们的隐私政策,去除非文字内容部分后,将每个句子根据单词的组成情况转化为特征向量;
步骤S102:根据步骤S101将数据集D中的隐私政策转化为特征向量,对每个句子根据隐私政策规范指定的不同类型进行分类,然后使用机器学习方法,构建不同的分类器;
步骤S103:根据步骤S102得到的分类器,对待检测软件S的隐私政策P分类,若P中拥有的类型不包含指定的全部类型,则判定隐私政策P不完整;
2)基于APP数据相关行为的隐私政策一致性分析:
步骤S104:把隐私政策P中有关用户数据属性的短语分隔为单词,将提取得到的单词表示为向量形式,对于短语则将多个单词进行向量加法运算,使用余弦相似性计算得到两个短语之间的相似性,构建相似短语集合DCP;
步骤S105:对待检测软件S进行反编译,写入获取用户界面组件的活动,重打包应用程序并在设备上运行,获取得到待检测软件S的用户界面组件,理解组件收集的数据类型;
步骤S106:使用数据流分析方法,识别获取特定数据的控件以及检查数据的传输对象,将组件与数据流关联,构建数据相关控件集合ACP;
步骤S107:比较步骤S104得到的DCP与步骤S106得到的ACP,如果ACP中存在的行为不包含在DCP中,则判定APP数据相关行为与隐私政策描述不一致。
2.根据权利要求1所述的方法,其特征在于,所述步骤S101具体为:
步骤S201:从获得的隐私政策HTML文件中删除所有非ASCII符号;
步骤S202:将处理后的文件提取文本内容,按句子为单位构建集合,并移除每个句子的终止符;
步骤S203:利用词干分析的思想,生成数据集的词袋模型;
步骤S204:将每个句子按照步骤S203得到的词带模型生成一个特征向量st,向量中的每个维度表征独立词的出现与否,特征向量的维度表示隐私政策中提取到的不同的单词,如果A句子出现了a单词,则A句子的特征向量对应a单词维度的向量值为1,否则为0。
3.根据权利要求1所述的方法,其特征在于,所述步骤S103中根据隐私政策的不同分类,将句子的特征向量依次通过每个分类器得到分类结果,对于隐私政策P,记Notice为P所包含的隐私政策类型集合,使用每个句子的预测结果更新Notice,最终若Notice不包含全部的隐私政策类型,则认为该隐私政策是不完整的,反之则是完整的。
4.根据权利要求1所述的方法,其特征在于,所述步骤S105中根据动态分析和静态分析结合的方法获...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。