本发明专利技术公开了一种APP特征识别方法和设备,该方法包括:从预设APP数据源获取APP数据;基于所述APP数据将对应的APP安装到测试终端;根据在所述测试终端上操作所述APP过程中的数据报文获取所述APP的域名访问信息;根据所述域名访问信息的可信度确定所述APP特征识别的结果,从而实现在进行大量APP特征识别时,在不增加成本的基础上提高APP特征识别的效率。
【技术实现步骤摘要】
一种APP特征识别方法和设备
本申请涉及大数据
,更具体地,涉及一种APP特征识别方法和设备。
技术介绍
APP(Application,应用程序)特征分析是指在APP运行期间通过对数据报文的分析,从而获得APP运行期间访问的域名信息。产生的域名信息一般应用于深度包检测技术(DPI),用来识别特定APP流量。目前对APP特征分析一般采用人工抓包分析的方式,其硬件设计图如图2所示,通过采用在抓包服务器上安装目前主流的抓包软件wireshark人工抓取测试手机对应IP数据包,然后根据个人经验分析出APP对应的数据包,然而在需要做大量APP特征识别时,就需要大量的人工,不仅增加了成本,还降低了识别效率。因此,如何在不增加成本的基础上提高APP特征识别的效率,是目前有待解决的技术问题。
技术实现思路
本专利技术提供一种APP特征识别方法,用以解决现有技术中进行大量APP特征识别时,所需成本高,识别效率低的技术问题,所述方法包括:从预设APP数据源获取APP数据,所述APP数据至少包括APP名称、开发者、下载地址和APP描述;基于所述APP数据将对应的APP安装到测试终端;根据在所述测试终端上操作所述APP过程中的数据报文获取所述APP的域名访问信息;根据所述域名访问信息的可信度确定所述APP特征识别的结果,所述可信度是根据所述域名访问信息与所述APP数据的匹配结果确定的。优选的,在根据所述域名访问信息的可信度确定所述APP特征识别的结果之前,还包括:根据所述域名访问信息对应的域名拼写信息和所述APP数据确定第一匹配结果;根据所述域名访问信息对应的域名访问结果和所述APP数据确定第二匹配结果;根据所述第一匹配结果和/或所述第二匹配结果确定所述可信度。优选的,根据所述域名访问信息对应的域名拼写信息和所述APP数据确定第一匹配结果,具体为:基于所述APP数据确定第一拼写信息,所述第一拼写信息包括APP名称的全拼、APP名称的声母、APP名称首字全拼后面采用声母的方式、开发者名称的全拼、开发者名称的声母、开发者名称首字全拼后面采用声母的方式;基于将所述域名拼写信息和所述第一拼写信息进行匹配确定所述第一匹配结果。优选的,根据所述域名访问信息对应的域名访问结果和所述APP数据确定第二匹配结果;基于所述APP数据确定第一名称信息,所述第一名称信息包括APP名称信息和开发者名称信息;基于访问与所述域名访问信息对应的全域名和主域名确定所述域名访问结果,所述域名访问结果包括标题信息和网页文本信息;基于将所述域名访问结果和所述第一名称信息进行匹配确定所述第二匹配结果。优选的,根据在所述测试终端上操作所述APP过程中的数据报文获取所述APP的域名访问信息,具体为:基于所述数据报文获取原始域名访问信息,并将所述原始域名访问信息输出到日志文件;基于所述日志文件确定所述原始域名访问信息中出现次数超过预设阈值的域名,所述出现次数为所述域名在历史APP操作数据中出现的次数;基于从所述原始域名访问信息中滤除所述出现次数超过预设阈值的域名获取所述域名访问信息。优选的,在根据在所述测试终端上操作所述APP过程中的数据报文获取所述APP的域名访问信息之前,还包括:基于预设操作流程对所述APP进行操作,所述预设操作流程包括启动APP,点击允许APP使用某些权限的按钮,点击是否跳过广告页面按钮,滑动屏幕到应用的主页面,点击下一步,填写登录信息或注册信息,点击登录按钮或注册按钮;基于所述操作的过程获取所述数据报文。优选的,在基于所述操作的过程获取所述数据报文之后,还包括:从所述测试终端中卸载所述APP。相应地,本专利技术还提出了一种APP特征识别设备,所述设备包括:第一获取模块,用于从预设APP数据源获取APP数据,所述APP数据至少包括APP名称、开发者、下载地址和APP描述;安装模块,用于基于所述APP数据将对应的APP安装到测试终端;第二获取模块,用于根据在所述测试终端上操作所述APP过程中的数据报文获取所述APP的域名访问信息;确定模块,用于根据所述域名访问信息的可信度确定所述APP特征识别的结果,所述可信度是根据所述域名访问信息与所述APP数据的匹配结果确定的。相应地,本专利技术还提出了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行如上任一项所述的APP特征识别方法。相应地,本专利技术还提出了一种计算机程序产品,所述计算机程序产品在终端设备上运行时,使得所述终端设备执行如上任一项所述的APP特征识别方法。与现有技术对比,本专利技术具备以下有益效果:本专利技术公开了一种APP特征识别方法和设备,该方法包括:从预设APP数据源获取APP数据;基于所述APP数据将对应的APP安装到测试终端;根据在所述测试终端上操作所述APP过程中的数据报文获取所述APP的域名访问信息;根据所述域名访问信息的可信度确定所述APP特征识别的结果,从而实现在进行大量APP特征识别时,在不增加成本的基础上提高APP特征识别的效率。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示出了本专利技术实施例提出的一种APP特征识别方法的流程示意图;图2示出了现有技术中APP特征识别的硬件设计示意图;图3示出了本专利技术另一实施例提出的一种APP特征识别方法的流程示意图;图4示出了本专利技术又一实施例提出的一种APP特征识别方法的流程示意图;图5示出了本专利技术实施例提出的一种APP特征识别设备的结构示意图;图6示出了本专利技术实施例中APP特征识别的硬件设计示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。如
技术介绍
所述,现有技术中在进行大量APP特征识别时,所需成本高,识别效率低。为解决上述问题,本申请实施例提出了APP特征识别方法,通过从预设APP数据源获取APP数据;基于所述APP数据将对应的APP安装到测试终端;根据在所述测试终端上操作所述APP过程中的数据报文获取所述APP的域名访问信息;根据所述域名访问信息的可信度确定所述APP特征识别的结果,从而实现在进行大量APP特征识别时,在不增加成本的基础上提高APP特征识别的效率。如图1所示为本专利技术实施例提出的一种APP本文档来自技高网...
【技术保护点】
1.一种APP特征识别方法,其特征在于,所述方法包括:/n从预设APP数据源获取APP数据,所述APP数据至少包括APP名称、开发者、下载地址和APP描述;/n基于所述APP数据将对应的APP安装到测试终端;/n根据在所述测试终端上操作所述APP过程中的数据报文获取所述APP的域名访问信息;/n根据所述域名访问信息的可信度确定所述APP特征识别的结果,所述可信度是根据所述域名访问信息与所述APP数据的匹配结果确定的。/n
【技术特征摘要】
1.一种APP特征识别方法,其特征在于,所述方法包括:
从预设APP数据源获取APP数据,所述APP数据至少包括APP名称、开发者、下载地址和APP描述;
基于所述APP数据将对应的APP安装到测试终端;
根据在所述测试终端上操作所述APP过程中的数据报文获取所述APP的域名访问信息;
根据所述域名访问信息的可信度确定所述APP特征识别的结果,所述可信度是根据所述域名访问信息与所述APP数据的匹配结果确定的。
2.如权利要求1所述的方法,其特征在于,在根据所述域名访问信息的可信度确定所述APP特征识别的结果之前,还包括:
根据所述域名访问信息对应的域名拼写信息和所述APP数据确定第一匹配结果;
根据所述域名访问信息对应的域名访问结果和所述APP数据确定第二匹配结果;
根据所述第一匹配结果和/或所述第二匹配结果确定所述可信度。
3.如权利要求2所述的方法,其特征在于,根据所述域名访问信息对应的域名拼写信息和所述APP数据确定第一匹配结果,具体为:
基于所述APP数据确定第一拼写信息,所述第一拼写信息包括APP名称的全拼、APP名称的声母、APP名称首字全拼后面采用声母的方式、开发者名称的全拼、开发者名称的声母、开发者名称首字全拼后面采用声母的方式;
基于将所述域名拼写信息和所述第一拼写信息进行匹配确定所述第一匹配结果。
4.如权利要求2所述的方法,其特征在于,根据所述域名访问信息对应的域名访问结果和所述APP数据确定第二匹配结果;
基于所述APP数据确定第一名称信息,所述第一名称信息包括APP名称信息和开发者名称信息;
基于访问与所述域名访问信息对应的全域名和主域名确定所述域名访问结果,所述域名访问结果包括标题信息和网页文本信息;
基于将所述域名访问结果和所述第一名称信息进行匹配确定所述第二匹配结果。
5.如权利要求1所述的方法,其特征在于,根据在所述测试终端上操作所述APP过程中的数据报文获取所述APP的域名...
【专利技术属性】
技术研发人员:时东各,陈永慈,
申请(专利权)人:北京京安佳新技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。