一种广告插件识别的方法和装置制造方法及图纸

技术编号:8980756 阅读:115 留言:0更新日期:2013-07-31 22:50
本发明专利技术公开了一种广告插件识别的方法和装置,涉及计算机技术领域。所述方法包括:查找应用插件相关的各文件;基于预定的广告的特征向量集的各特征维度的特征向量,扫描所述应用插件相关的各文件,计算所述各文件中的数据与所述各特征维度的特征向量的特征向量相似度;根据每个特征维度的特征向量相似度以及该特征维度的特征识别权重,计算当前应用插件的广告相似度;将所述广告相似度与阈值进行比较,根据比较结果,判定所述应用插件是否为广告插件。本发明专利技术取得了有完善的特征识别规则,并可结合云端数据进行特征识别,实现了广告软件的精、准识别,对混淆后的广告软件代码具有较高的特征匹配识别能力的有益效果。

【技术实现步骤摘要】
一种广告插件识别的方法和装置
本专利技术涉及计算机
,具体涉及一种广告插件识别的方法和装置。
技术介绍
随着技术的发展,智能移动终端也越来越普及,比如采用Android(安卓,一种基于Linux的自由及开放源代码的操作系统)的智能手机,iphone手机等。而随着智能移动终端(比如智能手机)的普及,各种移动应用也如雨后春笋般出现在智能移动终端上上,同时应用中也越来越多的嵌入广告插件,而恶意的广告软件轻则会骚扰用户,更严重的则会造成用户隐私泄露、特别对于用户手机来说,更可能耗费大量流量,甚至会偷偷发送扣费短信,给用户造成各种损失。而要保护用户免受恶意广告损害的第一步就是要识别哪些应用是广告软件,以及其危害,这样用户可以知晓广告软件是否为恶意广告以及危害程序,可以选择卸载该软件。同时也为进一步的广告拦截提供数据支持。目前,对于智能移动终端的广告插件识别,大都只是简单的固定的检测广告组件名来判断应用是否为广告插件,而由于很多广告方都把广告组件嵌入应用,而这种混淆后的软件代码,可能没有明显的组件名以进行区分,因此现有技术无法精确的识别广告插件,广告插件识别率低。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种广告插件识别系统和相应的一种广告插件识别方法。依据本专利技术的一个方面,提供了一种广告插件识别方法,包括:查找应用插件相关的各文件;基于预定的广告的特征向量集的各特征维度的特征向量,扫描所述应用插件相关的各文件,计算所述各文件中的数据与所述各特征维度的特征向量的特征向量相似度;根据每个特征维度的特征向量相似度以及该特征维度的特征识别权重,计算当前应用插件的广告相似度;将所述广告相似度与阈值进行比较,根据比较结果,判定所述应用插件是否为广告插件。可选的,还包括:通过云端服务器分析广告样本库中的各应用插件获取各特征维度下的特征数据,并根据所述特征数据构建广告的特征向量集。可选的,还包括:根据用户对应用插件的反馈信息,将反馈为包括广告的应用插件补充进入所述广告应用插件样本库。可选的,还包括:在云端服务器将所述各特征向量维度下的特征数据构建的广告的特征向量集预编译为二进制的XML格式。可选的,所述基于预定的广告的特征向量集的各特征维度的特征向量,扫描所述应用插件相关的各文件,计算所述各文件中的数据与所述各特征维度的特征向量的特征向量相似度包括:根据所述预定的广告的特征向量集的各特征维度指定的扫描位置,获取相应特征维度下的特征数据;将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量的特征值进行特征向量相似度计算,获取该特征维度下的特征向量相似度。可选的,所述根据所述预定的广告的特征向量集的各特征维度指定的扫描位置,获取相应特征维度下的特征数据包括:扫描所述应用插件的安装包,从所述安装包获取所述广告的特征向量集中安装包维度下的各特征信息作为第一特征向量;和/或,扫描所述配置文件,从所述配置文件中获取所述广告的特征向量集中配置信息维度下的各声明信息作为第一特征向量;和/或,扫描所述可执行文件中的常量池,从所述常量池获取所述广告的特征向量集中常量池维度下的各字符串作为第一特征向量;和/或,扫描所述可执行文件中的类结构,从所述类结构中获取所述广告的特征向量集中包名和类名维度下的各包名和类名作为第一特征向量;和/或,扫描所述可执行文件中的类结构,从所述类结构中获取所述广告的特征向量集中类继承关系序列维度下的各类继承关系作为第一特征向量;和/或,扫描所述可执行文件中的方法描述符,从所述方法描述符中获取所述广告的特征向量集中函数调用序列维度下的各函数调用序列作为第一特征向量。可选的,所述将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量的特征值进行特征向量相似度计算,获取该特征维度下的特征向量相似度包括:将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量对应的各种特征匹配条件进行匹配,根据匹配结果计算该特征维度下的特征向量相似度。可选的,还包括:记录对各应用插件扫描判断结果;当再次扫描时,根据对对各应用插件扫描判断结果的记录,跳过对已判断的应用插件的扫描。可选的,所述的查找应用插件相关的各文件包括:查找智能移动终端的应用平台中的应用插件相关的各文件。可选的,判定所述应用插件是否为广告插件之后还包括:检测所述广告插件对智能移动终端系统的操作行为。依据本专利技术的另一个方面,还提供了一种广告插件识别系统,包括:查找模块,适于查找应用插件相关的各文件;特征扫描模块,适于基于预定的广告的特征向量集的各特征维度的特征向量,扫描所述应用插件相关的各文件,计算所述各文件中的数据与所述各特征维度的特征向量的特征向量相似度;广告相似度计算模块,适于根据每个特征维度的特征向量相似度以及该特征维度的特征识别权重,计算当前应用插件的广告相似度;判断模块,适于将所述广告相似度与阈值进行比较,根据比较结果,判定所述应用插件是否为广告插件。可选的,还包括:云端服务器,所述云端服务器包括:特征向量集构建模块,适于通过云端服务器分析广告样本库中的各应用插件获取各特征维度下的特征数据,并根据所述特征数据构建广告的特征向量集。可选的,所述云端服务器还包括:反馈补充模块,适于根据用户对应用插件的反馈信息,将反馈为包括广告的应用插件补充进入所述广告应用插件样本库。可选的,还包括:特征向量集转换模块,适于在云端服务器将所述各特征向量维度下的特征数据构建的广告的特征向量集预编译为二进制的XML格式。可选的,所述特征扫描模块包括:特征数据提取模块,用于根据所述预定的广告的特征向量集的各特征维度指定的扫描位置,获取相应特征维度下的特征数据;特征数据分析模块,用于将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量的特征值进行特征向量相似度计算,获取该特征维度下的特征向量相似度。可选的,所述特征数据提取模块包括:应用插件扫描模块,适于扫描所述应用插件的安装包,从所述安装包获取所述广告的特征向量集中安装包维度下的各特征信息作为第一特征向量;和/或配置信息维度获取模块,适于扫描所述配置文件,从所述配置文件中获取与预置的广告的特征向量集中配置信息维度下的特征值相匹配的特征值;和/或,常量池维度获取模块,适于扫描所述可执行文件中的常量池,从所述常量池获取与预置的广告的特征向量集中常量池维度下的各字符串相匹配的字符串;和/或,包名和类名获取模块,适于扫描所述可执行文件中的类结构,从所述类结构中获取所述广告的特征向量集中包名和类名维度下的各包名和类名作为第一特征向量;和/或,类继承关系维度获取模块,适于扫描所述可执行文件中的类结构,从所述类结构中获取与预置的广告的特征向量集中类继承关系序列维度下的各类继承关系相匹配的类继承关系;和/或,函数调用序列维度获取模块,适于扫描所述可执行文件中的方法描述符,从所述方法描述符中获取与预置的广告的特征向量集中函数调用序列维度下的各函数调用序列相匹配的函数调用序列。可选的,所述特征数据分析模块包括:第一分析模块,食欲将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量对应的各种特征匹配条件进行匹配,根据匹配结果计算该特征维度下的特征向量相似度。可选的本文档来自技高网...
一种广告插件识别的方法和装置

【技术保护点】
一种广告插件识别方法,包括:查找应用插件相关的各文件;基于预定的广告的特征向量集的各特征维度的特征向量,扫描所述应用插件相关的各文件,计算所述各文件中的数据与所述各特征维度的特征向量的特征向量相似度;根据每个特征维度的特征向量相似度以及该特征维度的特征识别权重,计算当前应用插件的广告相似度;将所述广告相似度与阈值进行比较,根据比较结果,判定所述应用插件是否为广告插件。

【技术特征摘要】
1.一种广告插件识别方法,包括:查找应用插件相关的各文件;基于预定的广告的特征向量集的各特征维度的特征向量,扫描所述应用插件相关的各文件,计算所述各文件中的数据与所述各特征维度的特征向量的特征向量相似度;根据每个特征维度的特征向量相似度以及该特征维度的特征识别权重,计算当前应用插件的广告相似度;将所述广告相似度与阈值进行比较,根据比较结果,判定所述应用插件是否为广告插件;如果所述应用插件是广告插件,则检测所述广告插件对智能移动终端系统的操作行为;所述基于预定的广告的特征向量集的各特征维度的特征向量,扫描所述应用插件相关的各文件,计算所述各文件中的数据与所述各特征维度的特征向量的特征向量相似度包括:根据所述预定的广告的特征向量集的各特征维度指定的扫描位置,获取相应特征维度下的特征数据,其中,所述各特征维度的特征向量包括包名和类名维度特征向量,还包括:常量池维度特征向量、配置信息维度特征向量、类继承关系序列维度特征向量、函数调用序列维度特征向量和/或安装包维度特征向量;将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量的特征值进行特征向量相似度计算,获取该特征维度下的特征向量相似度。2.如权利要求1所述的方法,还包括:通过云端服务器分析广告样本库中的各应用插件获取各特征维度下的特征数据,并根据所述特征数据构建广告的特征向量集。3.如权利要求2所述的方法,还包括:根据用户对应用插件的反馈信息,将反馈为包括广告的应用插件补充进入所述广告应用插件样本库。4.如权利要求2所述的方法,还包括:在云端服务器将所述各特征向量维度下的特征数据构建的广告的特征向量集预编译为二进制的XML格式。5.如权利要求1所述的方法,所述根据所述预定的广告的特征向量集的各特征维度指定的扫描位置,获取相应特征维度下的特征数据包括:扫描所述应用插件的安装包,从所述安装包获取所述广告的特征向量集中安装包维度下的各特征信息作为第一特征向量;和/或,扫描配置文件,从所述配置文件中获取所述广告的特征向量集中配置信息维度下的各声明信息作为第一特征向量;和/或,扫描可执行文件中的常量池,从所述常量池获取所述广告的特征向量集中常量池维度下的各字符串作为第一特征向量;和/或,扫描所述可执行文件中的类结构,从所述类结构中获取所述广告的特征向量集中包名和类名维度下的各包名和类名作为第一特征向量;和/或,扫描所述可执行文件中的类结构,从所述类结构中获取所述广告的特征向量集中类继承关系序列维度下的各类继承关系作为第一特征向量;和/或,扫描所述可执行文件中的方法描述符,从所述方法描述符中获取所述广告的特征向量集中函数调用序列维度下的各函数调用序列作为第一特征向量。6.如权利要求5所述的方法,所述将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量的特征值进行特征向量相似度计算,获取该特征维度下的特征向量相似度包括:将所述特征数据与所述广告的特征向量集中相应特征维度下的特征向量对应的各种特征匹配条件进行匹配,根据匹配结果计算该特征维度下的特征向量相似度。7.如权利要求1所述的方法,还包括:记录对各应用插件扫描判断结果;当再次扫描时,根据对各应用插件扫描判断结果的记录,跳过对已判断的应用插件的扫描。8.如权利要求1所述的方法,所述的查找应用插件相关的各文件包括:查找智能移动终端的应用平台中的应用插件相关的各文件。9.一种广告插件识别系统,包括:查找模块,适于查找应用插件相关的各文件;特征扫描模...

【专利技术属性】
技术研发人员:张迪唐淳
申请(专利权)人:北京奇虎科技有限公司奇智软件北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1