一种盗版安卓应用甄别方法及盗版安卓应用甄别系统技术方案

技术编号:13798102 阅读:67 留言:0更新日期:2016-10-06 20:27
本发明专利技术公开了一种盗版安卓应用甄别方法及盗版安卓应用甄别系统。所述系统包括用于从安卓应用发布渠道采集安卓应用基本信息,下载安卓应用安装包的安卓应用渠道监测系统、用于对安卓应用基本信息及安卓应用安装包进行集中存储的安卓应用数据存储中心、用于基于安卓应用数据存储中心的海量安卓应用数据构建包含应用名称、应用介绍信息及版本信息的安卓应用信息表的安卓应用数据库、用于从预先构建的正版安卓应用信息表中选择待监测正版安卓应用,从安卓应用信息表中筛选出与待监测正版安卓应用相关联的所有疑似安卓应用,依照设定的安卓应用版本判定条件对该疑似安卓应用中的正版应用、旧版应用及盗版应用进行甄别的安卓应用差异化分析系统。

【技术实现步骤摘要】

本专利技术涉及安卓应用监控
,更具体地说,涉及一种盗版安卓应用甄别方法及盗版安卓应用甄别系统
技术介绍
目前,盗版安卓应用判定方法主要取决于应用的名称、包名、签名证书,即判定应用名称是否相似,包名是否相同,签名证书是否不同。如某款安卓应用同时符合上述三个条件,则判定该款安卓应用为盗版应用。实际上,一方面,对于同一应用的不同版本,可能因为原作者的签名证书到期换证,从而造成签名证书发生变化,同时因为应用发布渠道不同,可能出现渠道对所发布的应用重新签名的情况。另一方面,安卓应用基数庞大(超过100万款),且处于高速增长状态,在同一类型应用中出现应用名称相似的情况也是极为普遍,采用现有的盗版安卓应用判定方法进行盗版安卓应用的甄别,犹如大海捞针,不仅盗版应用判定效率低下,误判率高,而且,工作人员的工作负荷极高。再者,不少盗版者并不以替换正版应用为目的,故盗版应用的包名与正版应用的包名不一致的情况较为普遍。现有的盗版安卓应用判定方法无法甄别该类盗版应用。
技术实现思路
本专利技术要解决的技术问题在于针对现有技术的上述缺陷,提供一种盗版安卓应用甄别方法及盗版安卓应用甄别系统。本专利技术解决其技术问题所采用的技术方案是:构造一种盗版安卓应用甄别方法,所述方法包括如下步骤:S1、采集由各大安卓应用渠道网站发布的安卓应用基本信息,根据安卓应用基本信息中的应用下载地址从相关下载源下载安卓应用安装包,将采集的安卓应用基本信息及下载的安卓应用安装包汇总至安卓应用数据存储中心;S2、基于汇入安卓应用数据存储中心的海量安卓应用数据构建包含应用名称、应用介绍信息及版本信息的安卓应用数据库;S3、从正版安卓应用表中选择待监测正版安卓应用,根据输入的筛选条件从安卓应用数据库中筛选出与待监测正版安卓应用相关联的所有疑似安卓应用,并依照设定的安卓应用版本判定条件对该疑似安卓应用中的正版应用、旧版应用及盗版应用逐一进行甄别。在本专利技术上述盗版安卓应用甄别方法中,在所述步骤S1之前还包括如下步骤:S01、基于安卓应用开发商提供的正版安卓应用构建正版安卓应用信息表;S02、设定用于甄别正版安卓应用的第一判定条件、用于甄别历史版本安卓应用的第二判定条件及用于甄别盗版安卓应用的第三判定条件;其中所述第一判定条件如下:a1、应用名称相同;b1、安卓应用安装包的包
名相同;c1、版本信息相同;d1、签名证书相同;所述第二判定条件如下:a2、应用名称相同;b2、安卓应用安装包的包名相同;c2、版本信息不同;d2、签名证书相同;所述第三判定条件如下:a3、应用名称相似;b3、安卓应用安装包的包名相似;d3、签名证书不同;e、待监测正版安卓应用与疑似安卓应用的代码相似度不低于设定的代码相似度阈值;f、待监测正版安卓应用与疑似安卓应用的文本文件相似度不低于设定的文本文件相似度阈值;g、待监测正版安卓应用与疑似安卓应用的图像文件相似度不低于设定的图像文件相似度阈值。在本专利技术上述盗版安卓应用甄别方法中,所述步骤S3中根据输入的筛选条件从安卓应用信息表中筛选出与待监测正版安卓应用相关联的所有疑似安卓应用的步骤包括:将待监测正版安卓应用的应用名称、设定的应用监测关键字作为检索条件在安卓应用信息表中检索与该应用名称相似的安卓应用,或者应用介绍信息中包含该应用名称和/或该应用监测关键字的安卓应用,将检索到的安卓应用定义为待监测正版安卓应用的疑似安卓应用。在本专利技术上述盗版安卓应用甄别方法中,所述步骤S3中依照设定的安卓应用版本判定条件对该疑似安卓应用中的正版应用、旧版应用及盗版应用逐一进行甄别的步骤包括:对待监测正版安卓应用及所有疑似安卓应用进行反编译,分别得到待监测正版安卓应用的包名、签名证书、应用名称、资源文件、配置文件及smali文件,以及各款疑似安卓应用的包名、签名证书、应用名称、资源文件、配置文件及smali文件;将待监测正版安卓应用的应用名称、包名、签名证书、资源文件、配置
文件及smali文件与各款疑似安卓应用的应用名称、包名、签名证书、资源文件、配置文件及smali文件分别进行比对;如待监测正版安卓应用的应用名称、包名、版本信息、签名证书与某一款疑似安卓应用的应用名称、包名、版本信息、签名证书分别对应相同,则判定该款疑似安卓应用为待监测正版安卓应用的正版;如待监测正版安卓应用的应用名称、包名、签名证书与某款疑似安卓应用的应用名称、包名、签名证书对应相同,且待监测正版安卓应用的版本信息与该款疑似安卓应用的版本信息不同,则判定该款疑似安卓应用为该款待监测安卓应用的历史版本;如待监测正版安卓应用的应用名称、包名、签名证书与某款疑似安卓应用的应用名称、包名、签名证书各不相同,则对待监测正版安卓应用及该款疑似安卓应用进行相似度分析,基于应用相似度分析结果并结合预设的盗版安卓应用判定条件对该款疑似安卓应用是否属于盗版应用进行综合研判。在本专利技术上述盗版安卓应用甄别方法中,安卓应用相似度分析包括文本文件相似度分析、代码相似度分析及图像文件相似度分析;所述对待监测正版安卓应用及该款疑似安卓应用进行相似度分析的步骤包括:通过第一相似度计算公式计算待监测正版安卓应用与该款疑似安卓应用的每个文件的相似度及代码相似度;其中第一相似度计算公式如下:Xi=(1-J/D)*100%;Xi表示待监测正版安卓应用的其中一个文件与该款疑似安卓应用的对比文件的相似度;i表示安卓应用的文件编号顺序;J表示从源字符串至目标字符串需进行的编辑操作次数;D表示文件大小;根据第一相似度公式计算两款安卓应用的各对文件的相似度值及各对文件的相似度值的平均值,将所计算的相似度值的平均值作为待监测正版安卓应用与该款疑似安卓应用的文本文件相似度及代码相似度。在本专利技术上述盗版安卓应用甄别方法中,对待监测正版安卓应用及该款疑似安卓应用进行相似度分析的步骤还包括:通过第二相似度计算公式计算待监测正版安卓应用与该款疑似安卓应用的图像文件相似度;其中第二相似度计算公式如下:X2=(1-H0/10)*100%;X2表示待监测正版安卓应用及该款疑似安卓应用之间的图像相似度;H0表示平均汉明距离值,即待监测正版安卓应用及该款疑似安卓应用的各个图像文件的汉明距离值的平均值。在本专利技术上述盗版安卓应用甄别方法中,平均汉明距离值H0的计算过程包括如下步骤:将用于表征待监测正版安卓应用的第一个图像文件及该款疑似安卓应用的对比图像文件的相似度的第一汉明距离值设为H1,H为递增变量,且H的值默认为0;将待监测正版安卓应用的第一个图像文件及疑似安卓应用的对比图像文件分别缩小至8*8的图片尺寸,对该缩小尺寸后的第一图像文件及对比图像文件分别进行灰化处理;计算经灰化处理的第一个图像文件的每个像素的灰度及64个像素的灰度平均值,将第一个图像文件下的每个像素的灰度与64个像素的灰度平均值一
一进行比较,根据比较结果构建由数字0及数字1组成的8*8形式的第一数字矩阵;计算该疑似安卓应用的对比图像文件的各个像素的灰度及64个像素的灰度平均值,将该对比图像文件下的每个像素的灰度及64个像素的灰度平均值一一进行比较,根据比较结果构建由数字0及数字1组成的8*8形式的第二数字矩阵;将第一数字矩阵与第二数字矩阵中坐标位置相同的数本文档来自技高网
...

【技术保护点】
一种盗版安卓应用甄别方法,其特征在于,所述方法包括如下步骤:S1、采集由各大安卓应用渠道网站发布的安卓应用基本信息,根据安卓应用基本信息中的应用下载地址从相关下载源下载安卓应用安装包,将采集的安卓应用基本信息及下载的安卓应用安装包汇总至安卓应用数据存储中心;S2、基于汇入安卓应用数据存储中心的海量安卓应用数据构建包含应用名称、应用介绍信息及版本信息的安卓应用数据库;S3、从正版安卓应用表中选择待监测正版安卓应用,根据输入的筛选条件从安卓应用数据库中筛选出与待监测正版安卓应用相关联的所有疑似安卓应用,并依照设定的安卓应用版本判定条件对该疑似安卓应用中的正版应用、旧版应用及盗版应用逐一进行甄别。

【技术特征摘要】
1.一种盗版安卓应用甄别方法,其特征在于,所述方法包括如下步骤:S1、采集由各大安卓应用渠道网站发布的安卓应用基本信息,根据安卓应用基本信息中的应用下载地址从相关下载源下载安卓应用安装包,将采集的安卓应用基本信息及下载的安卓应用安装包汇总至安卓应用数据存储中心;S2、基于汇入安卓应用数据存储中心的海量安卓应用数据构建包含应用名称、应用介绍信息及版本信息的安卓应用数据库;S3、从正版安卓应用表中选择待监测正版安卓应用,根据输入的筛选条件从安卓应用数据库中筛选出与待监测正版安卓应用相关联的所有疑似安卓应用,并依照设定的安卓应用版本判定条件对该疑似安卓应用中的正版应用、旧版应用及盗版应用逐一进行甄别。2.根据权利要求1所述的盗版安卓应用甄别方法,其特征在于,在所述步骤S1之前还包括如下步骤:S01、基于安卓应用开发商提供的正版安卓应用构建正版安卓应用信息表;S02、设定用于甄别正版安卓应用的第一判定条件、用于甄别历史版本安卓应用的第二判定条件及用于甄别盗版安卓应用的第三判定条件;其中所述第一判定条件如下:a1、应用名称相同;b1、安卓应用安装包的包名相同;c1、版本信息相同;d1、签名证书相同;所述第二判定条件如下:a2、应用名称相同;b2、安卓应用安装包的包名相同;c2、版本信息不同;d2、签名证书相同;所述第三判定条件如下:a3、应用名称相似;b3、安卓应用安装包的包名相似;d3、签名证书不同;e、待监测正版安卓应用与疑似安卓应用的代码相似度不低于设定的代码相似度阈值;f、待监测正版安卓应用与疑似安卓应用的文本文件相似度不低于设定的文本文件相似度阈值;g、待监测正版安卓应用与疑似安卓应用的图像文件相似度不低于设定的图像文件相似度阈值。3.根据权利要求2所述的盗版安卓应用甄别方法,其特征在于,所述步骤S3中根据输入的筛选条件从安卓应用信息表中筛选出与待监测正版安卓应用相关联的所有疑似安卓应用的步骤包括:将待监测正版安卓应用的应用名称、设定的应用监测关键字作为检索条件在安卓应用信息表中检索与该应用名称相似的安卓应用,或者应用介绍信息中包含该应用名称和/或该应用监测关键字的安卓应用,将检索到的安卓应用定义为待监测正版安卓应用的疑似安卓应用。4.根据权利要求3所述的盗版安卓应用甄别方法,其特征在于,所述步骤S3中依照设定的安卓应用版本判定条件对该疑似安卓应用中的正版应用、旧版应用及盗版应用逐一进行甄别的步骤包括:对待监测正版安卓应用及所有疑似安卓应用进行反编译,分别得到待监测正版安卓应用的包名、签名证书、应用名称、资源文件、配置文件及smali文件,以及各款疑似安卓应用的包名、签名证书、应用名称、资源文件、配置文件及smali文件;将待监测正版安卓应用的应用名称、包名、签名证书、资源文件、配置文件及smali文件与各款疑似安卓应用的应用名称、包名、签名证书、资源文件、配置文件及smali文件分别进行比对;如待监测正版安卓应用的应用名称、包名、版本信息、签名证书与某一
\t款疑似安卓应用的应用名称、包名、版本信息、签名证书分别对应相同,则判定该款疑似安卓应用为待监测正版安卓应用的正版;如待监测正版安卓应用的应用名称、包名、签名证书与某款疑似安卓应用的应用名称、包名、签名证书对应相同,且待监测正版安卓应用的版本信息与该款疑似安卓应用的版本信息不同,则判定该款疑似安卓应用为该款待监测安卓应用的历史版本;如待监测正版安卓应用的应用名称、包名、签名证书与某款疑似安卓应用的应用名称、包名、签名证书各不相同,则对待监测正版安卓应用及该款疑似安卓应用进行相似度分析,基于应用相似度分析结果并结合预设的盗版安卓应用判定条件对该款疑似安卓应用是否属于盗版应用进行综合研判。5.根据权利要求4所述的盗版安卓应用甄别方法,其特征在于,安卓应用相似度分析包括文本文件相似度分析、代码相似度分析及图像文件相似度分析;所述对待监测正版安卓应用及该款疑似安卓应用进行相似度分析的步骤包括:通过第一相似度计算公式计算待监测正版安卓应用与该款疑似安卓应用的每个文件的相似度及代码相似度;其中第一相似度计算公式如下:Xi=(1-J/D)*100%;Xi表示待监测正版安卓应用的其中一个文件与该款疑似安卓应用的对比文件的相似度;i表示安卓应用的文件编号顺序;J表示从源字符串至目标字符串需进行的编辑操作次数;D表示文件大小;根据第一相似度公式计算两款安卓应用的各对文件的相似度值及各对文件的相似度值的平均值,将所计算的相似度值的平...

【专利技术属性】
技术研发人员:周建宁刘志诚王巍吴卓坤霍要峰陈文博王刚劳剑明
申请(专利权)人:卓望数码技术深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1