一种APP域名核验方法与系统技术方案

技术编号:22238153 阅读:39 留言:0更新日期:2019-10-09 18:02
本发明专利技术公开了一种APP域名核验方法,包括S1、获取待测APP所有操作产生的原始数据流量包;S2、以公共API知识库对原始数据流量包进行过滤,去除公共URL,获得剩余数据流量包;S3、对剩余数据流量包进行综合计算,对包括但不限于“URL请求次数”、“URL对应数据流量包的大小”、“URL与操作事件的对应关系”分别进行量化处理,归一化处理,再进行加权平均,获得一级域名对应的综合分值;S4、确定待测APP的实际域名,按照一级域名对应的综合分值进行从大到小排序;从序列中数值最大的一端开始,取至少1个一级域名设为APP的域名;S5、检验APP实际域名是否已进行备案;由此本发明专利技术可以确定并核验APP实际域名。本发明专利技术还公开了一种APP域名核验系统。

An APP Domain Name Verification Method and System

【技术实现步骤摘要】
一种APP域名核验方法与系统
本专利技术涉及域名检测领域,尤其涉及一种APP域名核验方法与系统。
技术介绍
随着科技的发展,智能手机已经成为现代社会不可或缺的工具,每一部手机上都存在着大量的APP,正是各类APP为用户的工作与生活提供了各种便利,但同时,也存在着诸多问题,例如:安卓程序恶意扣费或消耗流量套餐、窃取用户隐私资料、无提示联网下载软件等行为让人不齿,甚至有些APP涉及不雅内容影响青少年儿童的身心健康。政府部门为了对互联网经营者进行有效监管,防止在互联网上从事非法的网站经营活动,打击不良互联网信息的传播,出台了域名备案的管理办法,可以理解为,进行了域名备案的APP都是正规可信任的;APP域名未备案或者备案不完整的,其提供的网络服务是存在潜在风险的。通过核验需要访问的域名是否已经备案,可以判断其是否可信任。各类恶意扣费、消耗流量套餐、窃取用户隐私资料等的APP的域名普遍存在不进行备案或备案不完整的情况,若能对各APP的域名进行核验,就可以基本判定APP是否存在使用风险。但是通常的手段却无法完整查询。目前几乎没有现成的域名核验方法,域名核验和域名检测本质上类似,但是现有域名检测方法大部分都是针对DGA(DomainGenerateAlgorithm,域名生成方法)域名,针对APP域名的核验方法几乎没有。而针对DGA域名进行检测的方法也存在弊端,其主要是基于机器学习,构建分类器检测DGA域名,该类方法主要存在以下不足:一是需要预先收集训练数据,即耗时耗力;二是不在训练集中的DGA类型就不会被检测出来,即检测结果非常不准确。该类方法无法应用于APP域名的核验。为了保障用户使用APP的安全性,本专利技术提出了一种APP域名核验方法及系统,以获取APP实际使用的相关域名,并进一步核实该域名是否进行了备案,如果没有进行备案,那么该APP就是不可信的,提供的网络服务是存在潜在风险的。
技术实现思路
本专利技术所要解决的技术问题是:如何核验手机APP使用的相关域名。为解决上述技术问题,本专利技术所采用的技术方案是:一种APP域名核验方法,包括:S1、获取待测APP所有操作产生的原始数据流量包;S2、以公共API知识库对原始数据流量包进行过滤,去除公共URL,获得剩余数据流量包;S3、对剩余数据流量包进行综合计算;S4、确定待测APP的实际域名;S5、检验步骤S4中获得的APP实际域名是否已进行备案;所述步骤S3对剩余数据流量包进行综合计算,具体是指:对数据流量包中包括但不限于“URL请求次数”、“URL对应数据流量包的大小”、“URL与操作事件的对应关系”分别进行量化处理,归一化处理,再进行加权平均,获得一级域名对应的综合分值;更具体的来说:对URL以被访问次数进行统计,将含有相同“一级域名”的URL的被访问次数进行累加,然后归一化处理,得到一级域名对应的URL请求次数C;对URL以对应的数据流量包大小进行统计,将含有相同“一级域名”的数据流量包的大小进行累加,然后归一化处理,得到一级域名对应的数据流量包大小B;设置反映URL与操作事件的对应关系的“功能得分”,若点击行为1必然导致访问URL1,则URL1的功能得分+1,依次遍历所有点击行为,得到所有URL的功能得分,然后将含有相同一级域名的URL的功能得分进行累加,并进行归一化处理,得到一级域名对应的功能得分A;以下式进行加权平均:R=αA+βB+γC其中R为一级域名对应的综合分值;A为一级域名对应的功能得分;B为一级域名对应的数据流量包大小;C为一级域名对应的URL请求次数;α、β、γ为系数,α+β+γ=1;对获得的一级域名对应的综合分值进行从大到小的排序。所述步骤S4确定待测APP的域名,具体是指将域名按照步骤S3中获得的一级域名对应的综合分值进行从大到小排序;从序列中数值最大的一端开始,取至少1个一级域名作为APP的实际域名;也可以查看序列是否存在数据断层,取断层前的一级域名作为APP的实际域名,所述数据断层的判断标准如下:将域名对应综合分值按照从大到小排序,得到x1、x2、x3……xn-1、xn,若出现:xn-1-xn>K,0<k<1,则判断xn-1和xn之间出现数据断层,取xn之前的一级域名为待测APP的实际域名。在上述技术方案的基础上,本专利技术还可以做如下改进。所述步骤S1获取待测APP所有操作产生的原始数据流量包,具体是指:设置沙盒、自动安装卸载模块、控件识别模块、模拟点击模块,设置全局代理、临时数据库;所述自动安装卸载模块用于在沙盒中自动安装和卸载待测APP;所述控件识别模块用于获取待测APP的所有按钮;所述模拟点击模块负责模拟用户操作,遍历待测APP的所有操作;所述全局代理负责转发待测APP访问网络产生的所有数据流量包,并将转发的的所有数据流量包进行字段拆分并保存在所述临时数据库中;从而获取待测APP访问网络产生的所有原始数据流量包。所述步骤S2中的公共API知识库,初始以人工阅读各大公司的API文档的方式整理成现有的公共API知识库,后续在处理2个以上app时,将任意两个不同APP中的原始数据流量包进行交叉比对,将其交集部分添加到现有的公共API知识库中,实现对现有的公共API知识库的更新;具体步骤如下:S2-1、读取多个待测APP的数据流量包至数据集中,按APP名称分组;S2-2、读取第一个APP的全部数据流量包;S2-3、读取下一个APP的全部数据流量包;S2-4、交叉比较步骤S2-2与步骤S2-3读取的数据流量包,得出URL的交集,将该交集保存到现有的公共API知识库;S2-5、判断数据集中是否还有未被比较的APP;若有,跳至步骤S2-3;否则,跳至步骤S2-6;S2-6、从数据集中删除第一个APP的所有数据流量包;S2-7、判断数据集中是否还有APP数据流量包;若有,跳至步骤S2-2;否则,跳至步骤S2-8;S2-8、对公共API知识库进行去重处理;S2-9、查询备案信息,确认公共API知识库新增URL的所有者;S2-10、对公共API知识库进行保存。上述公共API知识库,只考虑域名,无视参数或文件差异。与现有技术相比,本专利技术具有如下技术效果:本系统提供了一种APP域名核验方法,可以获得APP的真实域名,并核验是否备案。本专利技术还公开了一种APP域名核验系统,包括:公共API知识库模块;沙盒模块;自动安装卸载模块、控件识别模块、模拟点击模块、全局代理模块;临时数据库模块;综合分析模块;域名核验模块;所述公共API知识库模块储存有公共API组件;所述沙盒模块为待测APP提供纯净的操作环境,避免数据污染;所述待测APP有所述自动安装卸载模块在所述沙盒模块内安装或卸载,所述待测APP通过所述全局代理模块访问互联网;所述控件识别模块用于获取待测APP所有的按钮;所述模拟点击模块用于模拟人员的操作,遍历待测APP所有的操作;所述全局代理模块负责转发待测APP访问网络产生的所有数据流量包,对转发的所有数据流量包的字段进行拆分,并储存在所述临时数据库模块内;所述综合分析模块负责对临时数据库模块中储存的数据流量包进行综合分析,以包括但不限于“URL请求次数”、“URL对应数据流量包的大小”、“URL与操作事件之间的关系”为特征,分别进行量化、归一本文档来自技高网
...

【技术保护点】
1.一种APP域名核验方法,其特征在于,包括以下步骤:S1、获取待测APP所有操作产生的原始数据流量包;S2、以公共API知识库对原始数据流量包进行过滤,去除公共URL,获得剩余数据流量包;S3、对剩余数据流量包进行综合计算;S4、确定待测APP的实际域名;S5、检验APP的实际域名是否已进行备案;所述步骤S3对剩余数据流量包进行综合计算,具体是指:对数据流量包中包括但不限于“URL请求次数”、“URL对应数据流量包的大小”、“URL与操作事件的对应关系”分别进行量化处理,归一化处理,再进行加权平均,获得一级域名对应的综合分值;所述步骤S4确定待测APP的域名,具体是指将域名按照步骤S3中获得的一级域名对应的综合分值进行从大到小排序;从序列中数值最大的一端开始,取至少1个一级域名作为APP的实际域名。

【技术特征摘要】
1.一种APP域名核验方法,其特征在于,包括以下步骤:S1、获取待测APP所有操作产生的原始数据流量包;S2、以公共API知识库对原始数据流量包进行过滤,去除公共URL,获得剩余数据流量包;S3、对剩余数据流量包进行综合计算;S4、确定待测APP的实际域名;S5、检验APP的实际域名是否已进行备案;所述步骤S3对剩余数据流量包进行综合计算,具体是指:对数据流量包中包括但不限于“URL请求次数”、“URL对应数据流量包的大小”、“URL与操作事件的对应关系”分别进行量化处理,归一化处理,再进行加权平均,获得一级域名对应的综合分值;所述步骤S4确定待测APP的域名,具体是指将域名按照步骤S3中获得的一级域名对应的综合分值进行从大到小排序;从序列中数值最大的一端开始,取至少1个一级域名作为APP的实际域名。2.根据权利要求1所述的APP域名核验方法,其特征在于,所述步骤S1获取待测APP所有操作产生的原始数据流量包,具体是指:设置沙盒、自动安装卸载模块、控件识别模块、模拟点击模块、全局代理、临时数据库;所述自动安装卸载模块用于在沙盒中自动安装和卸载待测APP;所述控件识别模块用于获取待测APP的所有按钮;所述模拟点击模块负责模拟用户操作,遍历待测APP的所有操作;所述全局代理负责转发待测APP访问网络产生的所有数据流量包,并将转发的的所有数据流量包进行字段拆分并保存在所述临时数据库中。3.根据权利要求1所述的APP域名核验方法,其特征在于,所述步骤S2中的公共API知识库,初始以人工阅读各大公司的API文档的方式整理成现有的公共API知识库,后续在处理2个以上app时,将任意两个不同APP中的原始数据流量包进行交叉比对,将其交集部分添加到现有的公共API知识库中,实现对现有的公共API知识库的更新;包括以下步骤:S2-1、读取多个待测APP的数据流量包至数据集中,按APP名称分组;S2-2、读取第一个APP的全部数据流量包;S2-3、读取下一个APP的全部数据流量包;S2-4、交叉比较步骤S2-2与步骤S2-3读取的数据流量包,得出URL的交集,将该交集保存到现有的公共API知识库;S2-5、判断数据集中是否还有未被比较的APP;若有,跳至步骤S2-3;否则,跳至步骤S2-6;S2-6、从数据集中删除第一个APP的所有数据流量包;S2-7、判断数据集中是否还有APP数据流量包;若有,跳至步骤S2-2;否则,跳至步骤S2-8;S2-8、对公共API知识库进行去重处理;S2-9、查询备案信息,确认公共API知识库新增URL的所有者;S2-10、对公共API知识库进行保存;所述公共API知识库,只考虑域名,无视参数或文件差异。4.如权利要求1所述的APP域名核验方法,其特征在于,所述步骤S3对剩余数据流量包进行综合计算,具体是指:对URL以被访问次数进行统计,将含有相同一级域名的URL的被访问次数进行累加,然后归一化处理,得到一级域名对应的URL请...

【专利技术属性】
技术研发人员:王海洋李雪梅刘大伟王丽萍徐健张旋
申请(专利权)人:烟台中科网络技术研究所
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1