【技术实现步骤摘要】
一种基于程序上下文的移动应用敏感行为描述生成方法
[0001]本专利技术涉及一种移动应用敏感行为描述生成方法,具体是一种基于程序上下文和应用文档的移动应用敏感行为描述生成方法,属于软件分析领域以及自然语言生成领域。
技术介绍
[0002]当前,智能手机蓬勃发展,移动应用凭借其便捷性和多元化逐渐渗透到生活的衣食住行方方面面,极大地满足人民需求,推动社会发展。为了更好地服务用户,应用会申请获取用户的某些敏感数据来提供支持,例如本地生活类应用会申请获取用户的位置信息为用户推荐附近的美食或者景点,音乐类应用会申请用户的联络人信息为不同的联络人设置不同的铃声。但是,恶意应用泛滥于市场,他们以非法方式收集用户的敏感数据,导致用户隐私的泄露与滥用,造成严重后果。保障用户合法权益、保护用户隐私数据势在必行。
[0003]目前,智能手机操作系统市场占有率最高的安卓采用权限机制来保护用户的隐私:在安卓6.0之前,移动应用列出它需要的所有权限,用户只能同意授予全部权限才能安装;安卓 6.0及以后,移动应用需要动态申请权限,移动应用在第一次 ...
【技术保护点】
【技术特征摘要】
1.一种基于程序上下文的移动应用敏感行为描述生成方法,其特征在于,利用移动应用的程序上下文信息和应用文档,通过提示学习微调GPT3自然语言生成模型,自动生成移动应用的敏感行为描述,方法包括以下步骤:(1)移动应用上下文提取(1.1)移动应用程序调用图构造:根据解包后的移动应用包,构造结合移动系统特点的程序调用图;(1.2)程序代码上下文提取:根据PScount构造敏感权限调用方法子图,得到敏感调用接口调用图序列;(1.3)图形界面上下文提取:根据程序调用图中方法和应用图形界面的映射关系,提取布局文件中的文字和资源名;(2)应用隐私权政策文档中敏感行为相关句子提取和补充从移动应用的隐私权政策文档中提取和补充应用敏感行为相关句子;包括根据关键词、结合机器阅读理解问答抽取敏感行为相关句子以及根据词频
‑
逆文档频率相似度为部分移动应用补充敏感行为相关句子两个步骤;(3)移动应用敏感行为描述生成使用移动应用上下文提取和应用隐私权政策文档中敏感行为相关句子提取和补充所得的移动应用敏感行为信息作为训练输入数据,基于提示学习微调GPT
‑
3模型;将训练所得的生成模型最终输出的生成结果作为结果报告。2.根据权利要求1所述的基于程序上下文的移动应用敏感行为描述生成方法,其特征在于,结合安卓移动应用特点构造程序调用图,提取程序代码上下文和图形界面上下文作为应用敏感行为信息;安卓程序是由组件构成,将组件间通信、生命周期事件、界面交互、多线程的调用关系纳入应用调用图构造;使用SOOT构造应用调用图,提取应用程序中所有类和所有方法,使用宽度优先搜索进行程序方法节点的扫描与拓展;如果扫描到的程序方法中的语句是关于生命周期事件、界面交互或多线程语句,则也执行加边操作;使用IC3工具分析安卓应用组件间通信过程,在获取组件通信的双方后,在调用图中进一步加入节点和有向调用边。3.根据权利要求1所述的基于程序上下文的移动应用敏感行为描述生成方法,其特征在于,程序代码上下文提取中,使用PScout提供的映射表在应用调用图中找到敏感权限调用方法,并用宽度优先搜索方法构造敏感权限调用方法子图;在敏感权限调用方法子图中,采用节点中方法签名里的方法名称作为程序代码上下文,根据驼峰命名法或下划线命名法分割方法名。4.根据权利要求1所述的基于程序上下文的移动应用敏感行为描述生成方法,其特征在于,图形界面上下文提取中,使用SOOT遍历应用程序中的方法体提取Activity绑定的布局文件id;根据敏感权限调用方法子图确定应用程序中使用了敏感权限的Activity,提取使用敏感权限的Activity与布局文件id的映射关系;解包移动应用包获取应用中布局文件名字和布局的映射关系,匹配出使用敏感权限的Activity与布局文件名称的绑定关系,提取资源中的文本属性和资源名作为图形界面上下文。5.根据权利要求1所述的基于程序上下文的移动应用敏感行为描述生成方法,其特征在于,根据关键词、结合机器阅读理解问答抽取与根据词频
‑
逆文档频率相似度补充敏感行
为相关句子;首先,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。