一种应用识别方法、装置、设备及存储介质制造方法及图纸

技术编号:27982744 阅读:25 留言:0更新日期:2021-04-06 14:18
本发明专利技术公开了一种应用识别方法、装置、设备及存储介质。该方法包括:获取目标终端发送的目标网络流量数据;对所述目标网络流量数据进行解析得到目标特征数据;根据所述目标特征数据查找应用识别特征库,确定所述目标特征数据对应的目标应用。通过本发明专利技术的技术方案,能够实现对海量应用的识别增强,效率提升且识别全面、准确性高,实现过程简单易适应网络时代APP日新月异的变化。

【技术实现步骤摘要】
一种应用识别方法、装置、设备及存储介质
本专利技术实施例涉及数据处理领域,尤其涉及一种应用识别的方法、装置、设备及存储介质。
技术介绍
随着移动互联网的发展壮大,各类应用(Application,APP)层出不穷。当前APP应用总量约为三百万,月均上下架的APP为十万数量级别。在众多APP产生的海量数据流量中反向识别出其对应的应用,成为一个繁重的工作。其中,大部分APP采用了HTTP或HTTPS协议进行通信。传统的增强应用识别的方法是投入大量人力对有限数量APP进行分析,然后通过编写模板的方式进行支持。这种方法不仅费时费力,而且难以跟上APP的变化速度,也难以覆盖足够多的APP。
技术实现思路
本专利技术实施例提供一种应用识别方法、装置、设备及存储介质,以实现能够实现对海量应用的识别增强,效率提升且识别全面、准确性高。第一方面,本专利技术实施例提供了应用识别,包括:获取目标终端发送的目标网络流量数据;对所述目标网络流量数据进行解析得到目标特征数据;根据所述目标特征数据查找应用识别特征库,识别所述目标特征数据对应的目标应用。进一步的,所述目标特征数据包括:目标HOST和/或目标SNI;相应的,根据所述目标特征数据查找应用识别特征库,确定所述目标特征数据对应的目标应用,包括:根据所述目标HOST查找应用识别特征库,确定所述目标HOST对应的目标应用ID和目标应用名称,或者,根据所述目标SNI查找应用识别特征库,确定所述目标SNI对应的目标应用ID和目标应用名称。进一步的,在获取目标终端发送的目标网络流量数据之前,还包括:通过模拟器安装至少一个应用;获取每个应用在运行期间产生的网络流量数据;将每个应用产生的网络流量数据均保存为PCAP文件,其中,所述PCAP文件携带所述网络流量数据对应的应用ID和应用名称。进一步的,在将每个应用产生的网络流量数据均保存为PCAP文件之后,包括:解析所述PCAP文件得到候选特征数据,以及所述候选特征数据对应的应用ID和应用名称;根据所述候选特征数据,以及所述候选特征数据对应的应用ID和应用名称确定每个应用ID对应的第一特征数据;将所述第一特征数据,以及所述第一特征数据对应的应用ID和应用名称存储至应用识别特征库。进一步的,根据所述候选特征数据,以及所述候选特征数据对应的应用ID和应用名称确定每个应用ID对应的第一特征数据,包括:获取所有应用对应的候选特征数据;根据所有应用对应的候选特征数据建立候选全局哈希表;通过所述候选全局哈希表选取每个应用ID对应的第一特征数据。进一步的,所述第一特征数据包括:全局唯一HOST和/或全局唯一SNI。第二方面,本专利技术实施例还提供了应用识别装置,该装置包括:第一获取模块,用于获取目标终端发送的目标网络流量数据;解析模块,用于对所述目标网络流量数据进行解析得到目标特征数据;识别模块,用于根据所述目标特征数据查找应用识别特征库,确定所述目标特征数据对应的目标应用。进一步的,所述目标特征数据包括:目标HOST和/或目标SNI;相应的,所述识别模块,具体用于:根据所述目标HOST查找应用识别特征库,确定所述目标HOST对应的目标应用ID和目标应用名称,或者,根据所述目标SNI查找应用识别特征库,确定所述目标SNI对应的目标应用ID和目标应用名称。进一步的,还包括:安装模块,用于在获取目标终端发送的目标网络流量数据之前,通过模拟器安装至少一个应用;第二获取模块,用于获取每个应用在运行期间产生的网络流量数据;保存模块,用于将每个应用产生的网络流量数据均保存为PCAP文件,其中,所述PCAP文件携带所述网络流量数据对应的应用ID和应用名称。进一步的,还包括:获得模块,用于在将每个应用产生的网络流量数据均保存为PCAP文件之后,解析所述PCAP文件得到候选特征数据,以及所述候选特征数据对应的应用ID和应用名称;确定模块,用于根据所述候选特征数据,以及所述候选特征数据对应的应用ID和应用名称确定每个应用ID对应的第一特征数据;存储模块,用于将所述第一特征数据,以及所述第一特征数据对应的应用ID和应用名称存储至应用识别特征库。进一步的,所述确定模块,具体用于:获取所有应用对应的候选特征数据;根据所有应用对应的候选特征数据建立候选全局哈希表;通过所述候选全局哈希表选取每个应用ID对应的第一特征数据。进一步的,所述第一特征数据包括:全局唯一HOST和/或全局唯一SNI。第三方面,本专利技术实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本专利技术实施例中任一所述的应用识别方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术实施例中任一所述的应用识别方法。本专利技术实施例通过解析目标终端发送的目标网络流量数据得到目标网络流量数据对应的目标特征数据,并根据目标特征数据查找应用识别特征库,从而确定相应的目标应用,解决传统的增强应用识别的方法只能对有限数量APP进行分析并通过编写模板的方式进行支持费时费力,难以跟上APP的变化速度,也难以覆盖足够多的APP的问题,实现对海量应用的识别增强,效率提升且识别全面、准确性高,实现过程简单易适应网络时代APP日新月异的变化。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1是本专利技术实施例一中的一种应用识别方法的流程图;图2是本专利技术实施例二中的一种应用识别方法的流程图;图2a是本专利技术实施例二中的一种自动抓包过程的流程图;图2b是本专利技术实施例二中的应用识别的整体拓扑方案图;图3是本专利技术实施例三中的一种应用识别装置的结构示意图;图4是本专利技术实施例四中的一种计算机设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本专利技术的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。实施例一图1为本专利技术实施例一提供的一种应用识别方法本文档来自技高网...

【技术保护点】
1.一种应用识别方法,其特征在于,包括:/n获取目标终端发送的目标网络流量数据;/n对所述目标网络流量数据进行解析得到目标特征数据;/n根据所述目标特征数据查找应用识别特征库,识别所述目标特征数据对应的目标应用。/n

【技术特征摘要】
1.一种应用识别方法,其特征在于,包括:
获取目标终端发送的目标网络流量数据;
对所述目标网络流量数据进行解析得到目标特征数据;
根据所述目标特征数据查找应用识别特征库,识别所述目标特征数据对应的目标应用。


2.根据权利要求1所述的方法,其特征在于,所述目标特征数据包括:目标HOST和/或目标SNI;
相应的,根据所述目标特征数据查找应用识别特征库,确定所述目标特征数据对应的目标应用,包括:
根据所述目标HOST查找应用识别特征库,确定所述目标HOST对应的目标应用ID和目标应用名称,或者,根据所述目标SNI查找应用识别特征库,确定所述目标SNI对应的目标应用ID和目标应用名称。


3.根据权利要求1所述的方法,其特征在于,在获取目标终端发送的目标网络流量数据之前,还包括:
通过模拟器安装至少一个应用;
获取每个应用在运行期间产生的网络流量数据;
将每个应用产生的网络流量数据均保存为PCAP文件,其中,所述PCAP文件携带所述网络流量数据对应的应用ID和应用名称。


4.根据权利要求3所述的方法,其特征在于,在将每个应用产生的网络流量数据均保存为PCAP文件之后,包括:
解析所述PCAP文件得到候选特征数据,以及所述候选特征数据对应的应用ID和应用名称;
根据所述候选特征数据,以及所述候选特征数据对应的应用ID和应用名称确定每个应用ID对应的第一特征数据;
将所述第一特征数据,以及所述第一特征数据对应的应用ID和应用名称存储至应用...

【专利技术属性】
技术研发人员:田慧萌万月亮火一莽
申请(专利权)人:北京锐安科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1