安卓应用程序中非权限相关隐私数据的识别方法技术

技术编号：12178921 阅读：63 留言：0更新日期：2015-10-08 17:05

本发明专利技术属于程序信息安全检测技术领域，具体为安卓应用程序中非权限相关隐私数据的识别方法。本发明专利技术方法分为数据预处理、隐私相关文本的分析、非权隐私相关界面元素的识别、基于代码静态信息流分析的果过滤四个阶段，主要针对处于Android系统的权限模型的保护范围之外的Android应用程序中非权限相关的隐私数据，将机器学习技术与传统静态信息流分析技术相结合进行识别。通过对此类隐私数据识别，能够将其标记为敏感数据源，进一步结合传统静态信息流分析检测技术或者动态污点信息跟踪检测技术，为此类隐私数据的监控和保护提供基础，从而降低用户隐私数据的泄露风险。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于程序信息安全检测
，具体设及利用自然语言处理、机器学习技术和静态信息流分析技术，识别Amlroid应用程序中非权限相关的隐私数据的方法。
技术介绍
[000引谈及Amlroid系统中的用户隐私信息，大致可分为两类，第一类为权限相关的用户隐私，第二类为非权限相关的用户隐私。其中，权限相关的用户隐私指的是通过调用 Amlroid系统权限模型提供的函数接口所能获得的用户隐私信息，如通过调用getlMElO 函数获取手机序列号、调用getLocationO函数获取用户地理位置信息等。由于安卓自身通过权限保护机制来管控该样的隐私数据，在调用此类函数获取隐私信息之前必须声明相应的权限，故称此类隐私信息为权限相关的隐私信息。相对而言，非权限相关的用户隐私设及范围更广，监控难度更大。此类隐私并非应用通过调用系统函数获得，而是通过直接与用户交互获取。如用户在使用购物类应用时所输入的网银账号信息，或是其他用户名、密码等信息，都属于非权限相关的用户隐私范畴。应用在获取到此类信息之后，可能将其W文件形式进行持久化存储或通过网络向服务器发送W实现特定功能。对于权限相关的隐私数据，由于其敏感数据源固定巧日上述getlMElO、 getLocationO等函数)，故可通过传统的静态信息流分析，对数据进行追踪和监控；而对于非权限相关的隐私数据而言，敏感数据源将随着具体应用程序的不同而不同，敏感数据与普通数据混杂在用户界面当中，因为它们均为用户使用应用所产生的数据。故从程序分析的角度，无法通过信息流分析、污点跟踪技术等对其进行有效的...
<a href="http://www.xjishu.com/zhuanli/55/CN104966031.html" title="安卓应用程序中非权限相关隐私数据的识别方法原文来自X技术">安卓应用程序中非权限相关隐私数据的识别方法</a>

【技术保护点】
一种安卓应用程序中非权限相关隐私数据的识别方法，将用户隐私数据分为三类：账户相关的认证信息以及用户数据、地理位置数据、金融支付类隐私数据；其特征在于识别的具体步骤分为四个阶段：一、数据预处理，包括：提取资源文件、文本预处理；其中：提取资源文件：首先采用Apktool对Android应用程序进行逆向工程，提取得到描述界面的资源文件；对于逆向工程后的Android应用程序，其描述界面的XML文件散布于不同的文件夹中；其中，用以描述用户交互界面（UI）的布局文件位于res/layout文件夹下；界面元素和其16进制ID的对应关系存储于res/value/public.xml文件中；界面中所展示的文本即界面文本位于/res/values/strings.xml文件中；文本预处理：使用Python的NLTK工具包进行文本预处理，包括文本分词、文本过滤、词干提取；其中：文本分词：对于上述获得的资源文件中，以变量名形式存在的文本，根据其分隔符或大小写对其进行分词；对于一些文本常量是由几个单词简单拼接而成的，从WordNet上获取词表，并不断从文本中切分出词表中所能匹配到的最长词；文本过滤：对于处理后...

【技术特征摘要】

【专利技术属性】
技术研发人员：杨珉，杨哲慜，南雨宏，周顺帆，张源，
申请(专利权)人：复旦大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人