应用名称相似度的确定方法、异常应用检测方法及系统技术方案

技术编号:19778330 阅读:24 留言:0更新日期:2018-12-15 11:19
本申请提供了一种应用名称相似度的确定方法、异常应用的检测方法及系统,其中异常应用检测方法包括:计算全网应用库中应用与待检测应用针对多个属性的相似度;其中,所述多个属性包括应用名称和应用图标;针对应用名称的相似度由全网应用库中应用的应用名称与关键词集中关键词的相似度确定;将多个属性的相似度输入至预设异常应用模型,经预设异常应用模型计算后输出多个属性的相似度的综合相似度;其中,所述预设异常应用模型为对多个属性的相似度进行综合计算的模型;若所述综合相似度大于预设相似度,且,该应用非待检测应用对应的正常应用,则确定该应用为所述待检测应用的异常应用。

【技术实现步骤摘要】
应用名称相似度的确定方法、异常应用检测方法及系统
本专利技术涉及移动安全、图像处理等领域,尤其涉及一种应用名称相似度的确定方法、异常应用检测方法及系统。
技术介绍
随着计算机技术和电子商务的飞速发展,信息安全成为人们越来越关注的重点。目前应用市场上的有很多仿冒正常应用的异常应用,异常应用可以通过应用名称来仿冒正常应用,以对用户产生误导。目前,可以基于正常应用的应用名称,在大量应用中检测出仿冒正常应用的异常应用。但是,由于一部分异常应用与正常应用的应用名称不一致,所以现有技术直接利用应用名称进行检测,会遗漏一部分仿冒正常应用的异常应用。
技术实现思路
本申请提供了一种应用名称相似度的确定方法、异常应用检测方法及系统,本申请可以提高异常应用的检测准确率。为了实现上述目的本申请提供了以下技术特征:一种异常应用检测系统,包括:应用提供设备,用于向应用检测设备上传待检测应用和与所述待检测应用的应用名称对应的关键词集;应用检测设备,用于接收所述待检测应用和与所述待检测应用的应用名称对应的关键词集,基于所述关键词集,计算全网应用库中应用与所述待检测应用针对应用名称的相似度,若全网应用库中应用满足预设条件,则确定该应用为所述待检测应用的异常应用;其中,所述预设条件包括全网应用库中应用与所述待检测应用针对应用名称的相似度大于预设相似度。可选的,所述预设条件还包括:全网应用库中的应用不在正常应用库中。一种异常应用检测方法,包括:确定待检测应用的关键词集;其中,所述关键词集包括一个或多个与所述待检测应用的应用名称类似的关键词;基于所述关键词集,计算全网应用库中应用与所述待检测应用针对应用名称的相似度;若全网应用库中应用满足预设条件,则确定该应用为所述待检测应用的异常应用;其中,所述预设条件包括全网应用库中应用与所述待检测应用针对应用名称的相似度大于预设相似度。可选的,所述基于所述关键词集,计算全网应用库中应用与所述待检测应用针对应用名称的相似度,包括:采用模糊匹配算法,计算全网应用库中应用的应用名称与所述关键词集中关键词的相似度;基于至少一个相似度,确定全网应用库中应用与所述待检测应用针对应用名称的相似度。可选的,还包括:确定异常应用的异常类型为应用名称异常;获取异常应用的应用信息;发送异常应用的应用信息和异常类型至应用提供设备。一种异常应用检测方法,包括:计算全网应用库中应用与待检测应用的多个针对属性的相似度;其中,所述多个针对属性的相似度包括:针对应用名称的相似度和针对应用图标的相似度;所述针对应用名称的相似度由全网应用库中应用的应用名称与关键词集中关键词的相似度确定;将多个针对属性的相似度输入至预设异常应用模型,经预设异常应用模型计算后输出多个针对属性的相似度的综合相似度;其中,所述预设异常应用模型为对多个属性的相似度进行综合计算的模型;若所述综合相似度大于预设相似度,且,该应用非所述待检测应用对应的正常应用,则确定该应用为所述待检测应用的异常应用。可选的,所述多个针对属性的相似度还包括:针对包名的相似度;则在将多个针对属性的相似度输入至预设异常应用模型之前,还包括:判断全网应用库中应用是否在正常应用库中;若是,则基于所述针对包名的相似度,判断该应用的包名与待检测应用的包名是否完全一致;若两者包名完全一致,则确定该应用为异常应用;若两者包名不完全一致,则将该应用的多个属性的相似度输入至预设异常应用模型。可选的,在将多个针对属性的相似度输入至预设异常应用模型之前,还包括:判断全网应用库中应用与是否在正常应用库中;若是,则确定该应用为待检测应用对应的正常应用;若否,则将该应用针对多个属性的相似度输入至预设异常应用模型。可选的,所述多个针对属性的相似度还包括:针对包名的相似度,则所述计算全网应用库中的应用与待检测应用的多个针对属性的相似度,包括:采用模糊匹配算法,计算全网应用库中应用的应用名称与所述待检测应用的关键词集中关键词的相似度,基于至少一个相似度确定全网应用库中应用与待检测应用针对应用名称的第一相似度;计算全网应用库中应用的应用图标与所述待检测应用的应用图标的第二相似度;计算全网应用库中应用的包名与所述待检测应用的包名的第三相似度。可选的,所述经预设异常应用模型计算后输出多个属性的相似度的综合相似度,包括:计算针对应用名称的第一相似度与第一预设权重的第一乘积;计算针对应用图标的第二相似度与第二预设权重的第二乘积;计算针对包名的第三相似度与第三预设权重的第三乘积;将所述第一乘积、所述第二乘积、所述第三乘积的和值,确定为所述综合相似度。可选的,所述预设异常应用模型的训练过程包括:获得若干个训练样本,训练样本包括应用与待检测应用分别针对应用名称、应用图标和包名的相似度,以及,人工标注的应用与待检测应用的综合相似度;构建异常应用模型;基于若干个训练样本对所述异常应用模型进行训练,获得所述第一预设权重、所述第二预设权重和所述第三预设权重。一种应用名称相似度的确定方法,包括:确定待检测应用的关键词集;其中,所述关键词集包括与所述待检测应用的应用名称类似的至少一个关键词;采用模糊匹配算法,计算应用的应用名称与所述关键词集中至少一个关键词的相似度;基于至少一个相似度,确定应用与待检测应用针对应用名称的相似度。可选的,还包括:若针对应用名称的相似度大于预设相似度,则确定该应用与所述待检测应用的应用名称相似。可选的,所述基于至少一个相似度,确定应用与待检测应用针对应用名称的相似度,包括:将所述至少一个相似度中的最大值,确定为应用与待检测应用针对应用名称的相似度;或,在所述至少一个相似度筛选多个相似度,将多个相似度的平均值确定为应用与待检测应用针对应用名称的相似度。一种应用检测方法,包括:获取待检测应用对应的关键词集;获取所述关键词集与已知应用名称的相似度;若所述相似度超过判断阈值,确定所述待检测应用为目标应用。可选的,所述关键词集包括一个或多个与所述待检测应用对应的关键词。通过以上技术手段,可以实现以下有益效果:本申请中不再直接通过待检测应用的应用名称来确定与待检测应用名称类似的异常应用,而是采用与待检测应用的应用名称相近或类似的关键词集来确定与待检测应用类似的异常应用。由于关键词集扩展了待检测应用的应用名称的范围,所以,可以在全网应用库中搜索到尽可能多与待检测应用的应用名称类似的应用,从而避免遗漏一部分异常应用。同时,本申请中将应用名称和应用图标结合来确定待检测应用的异常应用,从而使得检测结果更加准确。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种异常应用检测系统的结构示意图;图2为本申请实施例提供的一种异常应用检测方法的流程图;图3为本申请实施例提供的又一种异常应用检测方法的流程图;图4为本申请实施例提供的又一种异常应用检测方法的流程图;图5a-5b为本申请实施例提供的异常应用检测方法中确定可疑应用集的图示;图6为本申请实施例提供的应用检测方法的流程图。具体实施方式下面将结合本申请实本文档来自技高网...

【技术保护点】
1.一种异常应用检测系统,其特征在于,包括:应用提供设备,用于向应用检测设备上传待检测应用和与所述待检测应用的应用名称对应的关键词集;应用检测设备,用于接收所述待检测应用和与所述待检测应用的应用名称对应的关键词集,基于所述关键词集,计算全网应用库中应用与所述待检测应用针对应用名称的相似度,若全网应用库中应用满足预设条件,则确定该应用为所述待检测应用的异常应用;其中,所述预设条件包括全网应用库中应用与所述待检测应用针对应用名称的相似度大于预设相似度。

【技术特征摘要】
1.一种异常应用检测系统,其特征在于,包括:应用提供设备,用于向应用检测设备上传待检测应用和与所述待检测应用的应用名称对应的关键词集;应用检测设备,用于接收所述待检测应用和与所述待检测应用的应用名称对应的关键词集,基于所述关键词集,计算全网应用库中应用与所述待检测应用针对应用名称的相似度,若全网应用库中应用满足预设条件,则确定该应用为所述待检测应用的异常应用;其中,所述预设条件包括全网应用库中应用与所述待检测应用针对应用名称的相似度大于预设相似度。2.如权利要求1所述的系统,其特征在于,所述预设条件还包括:全网应用库中的应用不在正常应用库中。3.一种异常应用检测方法,其特征在于,包括:确定待检测应用的关键词集;其中,所述关键词集包括一个或多个与所述待检测应用的应用名称类似的关键词;基于所述关键词集,计算全网应用库中应用与所述待检测应用针对应用名称的相似度;若全网应用库中应用满足预设条件,则确定该应用为所述待检测应用的异常应用;其中,所述预设条件包括全网应用库中应用与所述待检测应用针对应用名称的相似度大于预设相似度。4.如权利要求3所述的方法,其特征在于,所述基于所述关键词集,计算全网应用库中应用与所述待检测应用针对应用名称的相似度,包括:采用模糊匹配算法,计算全网应用库中应用的应用名称与所述关键词集中关键词的相似度;基于至少一个相似度,确定全网应用库中应用与所述待检测应用针对应用名称的相似度。5.如权利要求3所述的方法,其特征在于,还包括:确定异常应用的异常类型为应用名称异常;获取异常应用的应用信息;发送异常应用的应用信息和异常类型至应用提供设备。6.一种异常应用检测方法,其特征在于,包括:计算全网应用库中应用与待检测应用的多个针对属性的相似度;其中,所述多个针对属性的相似度包括:针对应用名称的相似度和针对应用图标的相似度;所述针对应用名称的相似度由全网应用库中应用的应用名称与关键词集中关键词的相似度确定;将多个针对属性的相似度输入至预设异常应用模型,经预设异常应用模型计算后输出多个针对属性的相似度的综合相似度;其中,所述预设异常应用模型为对多个属性的相似度进行综合计算的模型;若所述综合相似度大于预设相似度,且,该应用非所述待检测应用对应的正常应用,则确定该应用为所述待检测应用的异常应用。7.如权利要求6所述的方法,其特征在于,所述多个针对属性的相似度还包括:针对包名的相似度;则在将多个针对属性的相似度输入至预设异常应用模型之前,还包括:判断全网应用库中应用是否在正常应用库中;若是,则基于所述针对包名的相似度,判断该应用的包名与待检测应用的包名是否完全一致;若两者包名完全一致,则确定该应用为异常应用;若两者包名不完全一致,则将该应用的多个属性的相似度输入至预设异常应用模型。8.如权利要求6所述的方法,...

【专利技术属性】
技术研发人员:黎波肖天明汪海颉小凤
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1