文件验证方法及装置制造方法及图纸

技术编号:13921957 阅读:132 留言:0更新日期:2016-10-27 22:51
本发明专利技术公开了一种文件验证方法及装置,属于网络技术领域。所述方法包括:从待验证文件中提取文件摘要数据,所述待验证文件为待验证应用的安装包;根据所述文件摘要数据,生成所述待验证文件的特征字符串;根据所述待验证文件的特征字符串,从特征数据库中确定目标文件的文件信息,所述目标文件为与所述待验证文件的特征字符串匹配的文件;根据所述目标文件的文件信息和所述待验证文件的文件信息,对所述待验证文件进行验证。本发明专利技术能够实现主动收集待验证文件,并验证其是属于正版应用还是属于正版应用的仿冒版本,从而能够对仿冒应用进行打击,保障用户信息安全及服务商利益。

【技术实现步骤摘要】

本专利技术涉及网络
,特别涉及一种文件验证方法及装置
技术介绍
随着网络和智能终端的普及,以及网络技术的不断发展,服务商通过可安装的APK(Application Package,应用程序包)向用户提供服务,也即是,终端通过安装APK,来使用服务商提供的服务。而有些开发者会恶意模仿合法或官方应用程序,以达到侵犯用户隐私和服务商利益的目的,为了避免发生上述情况,需要对APK进行验证,以判断该APK是否为仿冒APK,从而保护用户隐私和服务商利益。在相关技术中,目前验证APK的方法可以为:用户或开发人员在发现任一应用程序可能仿冒了其他应用程序时,对该应用程序进行举报,验证人员根据该举报信息后,对所举报应用程序的APK进行人工验证,以获取验证结果。在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下问题:上述文件验证方法过分依赖人力,出现漏检仿冒APK文件的风险,进而导致用户信息安全和服务商利益存在潜在威胁。
技术实现思路
为了解决现有技术的问题,本专利技术实施例提供了一种文件验证方法及装置。所述技术方案如下:一方面,提供了一种文件验证方法,所述方法包括:从待验证文件中提取文件摘要数据,所述待验证文件为待验证应用的安装包,所述文件摘要数据用于唯一标识所述待验证文件的文件内容;根据所述文件摘要数据,生成所述待验证文件的特征字符串;根据所述待验证文件的特征字符串,从特征数据库中确定目标文件的文件信息,所述目标文件为与所述待验证文件的特征字符串匹配的文件,所述特征数据库中至少存储有多个正版文件的文件信息和特征字符串,所述文件信息至少包括证书特征值;根据所述目标文件的文件信息和所述待验证文件的文件信息,对所述待验证文件进行验证。另一方面,提供了一种文件验证装置,所述装置包括:文件摘要数据提取模块,用于从待验证文件中提取文件摘要数据,所述待验证文件为待验证应用的安装包,所述文件摘要数据用于唯一标识所述待验证文件的文件内容;特征字符串生成模块,用于根据所述文件摘要数据,生成所述待验证文件的特征字符串;目标文件确定模块,用于根据所述待验证文件的特征字符串,从特征数据库中确定目标文件的文件信息,所述目标文件为与所述待验证文件的特征字符串匹配的文件,所述特征数据库中至少存储有多个正版文件的文件信息和特征字符串,所述文件信息至少包括证书特征值;验证模块,用于根据所述目标文件的文件信息和所述待验证文件的文件信息,对所述待验证文件进行验证。本专利技术实施例提供的技术方案带来的有益效果是:通过从待验证文件中提取文件摘要数据,并根据该文件摘要数据生成该待验证文件的特征字符串,再根据该带验证文件的特征字符串,从特征数据库中确定目标文件的文件信息,以根据该目标文件的文件信息,对该待验证文件进行验证,能够实现主动收集待验证文件,并验证其是属于正版应用还是属于正版应用的仿冒版本,并将验证结果对应存储至特征数据库中,从而能够对仿冒应用进行打击,保障用户信息安全及服务商利益。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种文件验证方法流程图;图2A是本专利技术实施例提供的一种文件验证方法流程图;图2B是本专利技术实施例提供的一种第二特征字符串生成方法流程图;图2C是本专利技术实施例提供的一种根据特征字符串的验证流程图;图2D是本专利技术实施例提供的一种特征字符串存储流程图;图2E是本专利技术实施例提供的一种查询方法流程图;图2F是本专利技术实施例提供的一种文件验证方法流程图;图3是本专利技术实施例提供的一种文件验证装置框图;图4是本专利技术实施例提供的一种用于文件验证的装置400的框图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本专利技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本专利技术的一些方面相一致的装置和方法的例子。图1是本专利技术实施例提供的一种文件验证方法流程图,如图1所示,包括以下步骤:101、从待验证文件中提取文件摘要数据,所述待验证文件为待验证应用的安装包,所述文件摘要数据用于唯一标识所述待验证文件的文件内容。102、根据所述文件摘要数据,生成所述待验证文件的特征字符串。103、根据所述待验证文件的特征字符串,从特征数据库中确定目标文件的文件信息,所述目标文件为与所述待验证文件的特征字符串匹配的文件,所述特征数据库中至少存储有多个正版文件的文件信息和特征字符串,所述文件信息至少包括证书特征值。104、根据所述目标文件的文件信息和所述待验证文件的文件信息,对所述待验证文件进行验证。本专利技术实施例提供的方法,通过从待验证文件中提取文件摘要数据,并根据该文件摘要数据生成该待验证文件的特征字符串,再根据该带验证文件的特征字符串,从特征数据库中确定目标文件的文件信息,以根据该目标文件的文件信息,对该待验证文件进行验证,能够实现主动收集待验证文件,并验证其是属于正版应用还是属于正版应用的仿冒版本,并将验证结果对应存储至特征数据库中,从而能够对仿冒应用进行打击,保障用户信息安全及服务商利益。在本专利技术的第一种可能实现方式中,根据所述目标文件的文件信息和所述待验证文件的文件信息,对所述待验证文件进行验证包括:如果所述目标文件的文件信息与所述待验证文件的文件信息一致,对所述待验证文件验证通过;如果所述目标文件的文件信息与所述待验证文件的文件信息不一致,对所述待验证文件验证不通过。在本专利技术的第二种可能实现方式中,所述根据所述待验证文件的特征字符串,从特征数据库中确定目标文件的文件信息包括:计算所述待验证文件的特征字符串与所述特征数据库中每个特征字符串的相似度;将相似度在预设范围内的特征字符串对应的文件确定为所述待验证文件的目标文件。在本专利技术的第三种可能实现方式中,所述相似度为汉明距离。在本专利技术的第四种可能实现方式中,所述文件摘要数据为摘要文件,所述摘要文件中存储有所述待验证文件中所有资源文件的文件名称、文件类型和摘要信息;相应地,所述根据所述文件摘要数据,生成所述待验证文件的特征字符串包括:根据所述所有资源文件的文件名称、文件类型和摘要信息,按照指定规则生成特征文本;根据所述特征文本,生成所述待验证文件的特征字符串。在本专利技术的第五种可能实现方式中,所述根据所述特征文本,生成所述待验证文件的特征字符串包括:根据所述特征文本,通过敏感哈希simhash算法生成所述待验证文件的特征字符串。在本专利技术的第六种可能实现方式中,所述根据所述所有资源文件的文件名称、文件类型和摘要信息,按照指定规则生成特征文本包括:根据所述所有资源文件的文件类型,从所述所有资源文件中获取指定摘要信息,所述指定摘要信息为指定类型资源文件的摘要信息;根据所述指定摘要信息生成所述特征文本。在本专利技术的第七种可能实现方式中,所述文件摘要数据为所述待验证应本文档来自技高网...

【技术保护点】
一种文件验证方法,其特征在于,所述方法包括:从待验证文件中提取文件摘要数据,所述待验证文件为待验证应用的安装包,所述文件摘要数据用于唯一标识所述待验证文件的文件内容;根据所述文件摘要数据,生成所述待验证文件的特征字符串;根据所述待验证文件的特征字符串,从特征数据库中确定目标文件的文件信息,所述目标文件为与所述待验证文件的特征字符串匹配的文件,所述特征数据库中至少存储有多个正版文件的文件信息和特征字符串,所述文件信息至少包括证书特征值;根据所述目标文件的文件信息和所述待验证文件的文件信息,对所述待验证文件进行验证。

【技术特征摘要】
1.一种文件验证方法,其特征在于,所述方法包括:从待验证文件中提取文件摘要数据,所述待验证文件为待验证应用的安装包,所述文件摘要数据用于唯一标识所述待验证文件的文件内容;根据所述文件摘要数据,生成所述待验证文件的特征字符串;根据所述待验证文件的特征字符串,从特征数据库中确定目标文件的文件信息,所述目标文件为与所述待验证文件的特征字符串匹配的文件,所述特征数据库中至少存储有多个正版文件的文件信息和特征字符串,所述文件信息至少包括证书特征值;根据所述目标文件的文件信息和所述待验证文件的文件信息,对所述待验证文件进行验证。2.根据权利要求1所述的方法,其特征在于,根据所述目标文件的文件信息和所述待验证文件的文件信息,对所述待验证文件进行验证包括:如果所述目标文件的文件信息与所述待验证文件的文件信息一致,对所述待验证文件验证通过;如果所述目标文件的文件信息与所述待验证文件的文件信息不一致,对所述待验证文件验证不通过。3.根据权利要求1所述的方法,其特征在于,所述根据所述待验证文件的特征字符串,从特征数据库中确定目标文件的文件信息包括:计算所述待验证文件的特征字符串与所述特征数据库中每个特征字符串的相似度;将相似度在预设范围内的特征字符串对应的文件确定为所述待验证文件的目标文件。4.根据权利要求3所述的方法,其特征在于,所述相似度为汉明距离。5.根据权利要求1所述的方法,其特征在于,所述文件摘要数据为摘要文件,所述摘要文件中存储有所述待验证文件中所有资源文件的文件名称、文件类型和摘要信息;相应地,所述根据所述文件摘要数据,生成所述待验证文件的特征字符串包括:根据所述所有资源文件的文件名称、文件类型和摘要信息,按照指定规则生成特征文本;根据所述特征文本,生成所述待验证文件的特征字符串。6.根据权利要求5所述的方法,其特征在于,所述根据所述特征文本,生成所述待验证文件的特征字符串包括:根据所述特征文本,通过敏感哈希simhash算法生成所述待验证文件的特征字符串。7.根据权利要求5所述的方法,其特征在于,所述根据所述所有资源文件的文件名称、文件类型和摘要信息,按照指定规则生成特征文本包括:根据所述所有资源文件的文件类型,从所述所有资源文件中获取指定摘要信息,所述指定摘要信息为指定类型资源文件的摘要信息;根据所述指定摘要信息生成所述特征文本。8.根据权利要求1所述的方法,其特征在于,所述文件摘要数据为所述待验证应用的应用图标;相应地,所述根据所述文件摘要数据,生成所述待验证文件的特征字符串包括:根据所述待验证应用的应用图标,生成所述待验证文件的特征字符串。9.根据权利要求8所述的方法,其特征在于,根据所述待验证应用的应用图标,生成所述待验证文件的特征字符串包括:根据所述待验证应用的应用图标,通过感知哈希pHash算法或尺度不变特征变换SIFT算法生成所述待验证文件的特征字符串。10.根据权利要求1所述的方法,其特征在于,所述文件摘要数据包括所述待验证应用的应用图标和所述摘要文件,相应地,所述根据所述文件摘要数据,生成所述待验证文件的特征字符串包括:根据所述待验证应用的应用图标,生成所述待验证文件的第一特征字符串;根据所述摘要文件生成特征文本,并根据所述特征文本生成所述待验证文件的第二特征字符串;根据所述第一特征字符串和所述第二特征字符串,生成所述待验证文件的特征字符串。11.根据权利要求1所述的方法,其特征在于,所述特征数据库中还存储有白名单,相应地,所述根据所述目标文件的文件信息和所述待验证文件的文件信息,对所述待验证文件进行验证包括:如果所述目标文件的文件信息与所述待验证文件的文件信息不一致,查询所述白名单中是否存储有所述待验证文件的文件信息;如果所述白名单中存储有所述待验证文件的文件信息,对所述待验证文件验证通过;如果所述白名单中未存储有所述待验证文件的文件信息,对所述待验证文件验证不通过。12.根据权利要求11所述的方法,其特征在于,所述白名单中存储有所有正版文件的文件信息。13.根据权利要求1所述的方法,其特征在于,所述根据所述目标文件的文件信息和所述待验证文件的文件信息,对所述待验证文件进行验证之后,所述方法还包括:如果所述待验证文件验证通过,将所述待验证文件的特征字符串和文件信息存储至所述特征数据库中。14.根据权利要求1所述的方法,其特征在于,所述特征数据库中还存储有多个非正版文件的文件信息、特征字符串以及所述多个正版文件和所述多个非正版文件中每个文件的验证结果,相应地,所述根据所述目标文件的文件信息和所述待验证文件的文件信息,对所述待验证文件进行验证包括:如果所述目标文件的文件信息与所述待验证文件的文件信息一致,且所述目标文件为验证通过文件,对所述待验证文件验证通过;如果所述目标文件的文件信息与所述待验证文件的文件信息一致,且所述目标文件为验证不通过文件,对所述待验证文件验证不通过。15.根据权利要求14所述的方法,其特征在于,根据所述目标文件的文件信息和所述待验证文件的文件信息,对所述待验证文件进行验证之后,所述方法还包括:将所述待验证文件的特征字符串、文件信息和验证结果存储至所述特征数据库中。16.根据权利要求14所述的方法,其特征在于,所述文件信息还包括文件名称,相应地,所述方法还包括:接收查询请求,所述查询请求至少携带待查询文件的文件名称;根据所述文件名称,从所述特征数据库中获取至少一个匹配文件的文件名称及对应验证结果;向所述查询请求的发送端反馈查询结果,所述查询结果...

【专利技术属性】
技术研发人员:黄武
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1