【技术实现步骤摘要】
本专利技术涉及网络
,特别涉及一种文件验证方法及装置。
技术介绍
随着网络和智能终端的普及,以及网络技术的不断发展,服务商通过可安装的APK(Application Package,应用程序包)向用户提供服务,也即是,终端通过安装APK,来使用服务商提供的服务。而有些开发者会恶意模仿合法或官方应用程序,以达到侵犯用户隐私和服务商利益的目的,为了避免发生上述情况,需要对APK进行验证,以判断该APK是否为仿冒APK,从而保护用户隐私和服务商利益。在相关技术中,目前验证APK的方法可以为:用户或开发人员在发现任一应用程序可能仿冒了其他应用程序时,对该应用程序进行举报,验证人员根据该举报信息后,对所举报应用程序的APK进行人工验证,以获取验证结果。在实现本专利技术的过程中,专利技术人发现现有技术至少存在以下问题:上述文件验证方法过分依赖人力,出现漏检仿冒APK文件的风险,进而导致用户信息安全和服务商利益存在潜在威胁。
技术实现思路
为了解决现有技术的问题,本专利技术实施例提供了一种文件验证方法及装置。所述技术方案如下:一方面,提供了一种文件验证方法,所述方法包括:从待验证文件中提取文件摘要数据,所述待验证文件为待验证应用的安装包,所述文件摘要数据用于唯一标识所述待验证文件的文件内容;根据所述文件摘要数据,生成所述待验证文件的特征字符串;根据所述待验证文件的特征字符串,从特征数据库中确定目标文件的文件信息,所述目标文件为与所述待验证文件的特征字符串匹配的文件,所述特征数据库中至少存储有多个正版文件的文件信息和特征字符串,所述文件信息至少包括证书特征值;根据所述 ...
【技术保护点】
一种文件验证方法,其特征在于,所述方法包括:从待验证文件中提取文件摘要数据,所述待验证文件为待验证应用的安装包,所述文件摘要数据用于唯一标识所述待验证文件的文件内容;根据所述文件摘要数据,生成所述待验证文件的特征字符串;根据所述待验证文件的特征字符串,从特征数据库中确定目标文件的文件信息,所述目标文件为与所述待验证文件的特征字符串匹配的文件,所述特征数据库中至少存储有多个正版文件的文件信息和特征字符串,所述文件信息至少包括证书特征值;根据所述目标文件的文件信息和所述待验证文件的文件信息,对所述待验证文件进行验证。
【技术特征摘要】
1.一种文件验证方法,其特征在于,所述方法包括:从待验证文件中提取文件摘要数据,所述待验证文件为待验证应用的安装包,所述文件摘要数据用于唯一标识所述待验证文件的文件内容;根据所述文件摘要数据,生成所述待验证文件的特征字符串;根据所述待验证文件的特征字符串,从特征数据库中确定目标文件的文件信息,所述目标文件为与所述待验证文件的特征字符串匹配的文件,所述特征数据库中至少存储有多个正版文件的文件信息和特征字符串,所述文件信息至少包括证书特征值;根据所述目标文件的文件信息和所述待验证文件的文件信息,对所述待验证文件进行验证。2.根据权利要求1所述的方法,其特征在于,根据所述目标文件的文件信息和所述待验证文件的文件信息,对所述待验证文件进行验证包括:如果所述目标文件的文件信息与所述待验证文件的文件信息一致,对所述待验证文件验证通过;如果所述目标文件的文件信息与所述待验证文件的文件信息不一致,对所述待验证文件验证不通过。3.根据权利要求1所述的方法,其特征在于,所述根据所述待验证文件的特征字符串,从特征数据库中确定目标文件的文件信息包括:计算所述待验证文件的特征字符串与所述特征数据库中每个特征字符串的相似度;将相似度在预设范围内的特征字符串对应的文件确定为所述待验证文件的目标文件。4.根据权利要求3所述的方法,其特征在于,所述相似度为汉明距离。5.根据权利要求1所述的方法,其特征在于,所述文件摘要数据为摘要文件,所述摘要文件中存储有所述待验证文件中所有资源文件的文件名称、文件类型和摘要信息;相应地,所述根据所述文件摘要数据,生成所述待验证文件的特征字符串包括:根据所述所有资源文件的文件名称、文件类型和摘要信息,按照指定规则生成特征文本;根据所述特征文本,生成所述待验证文件的特征字符串。6.根据权利要求5所述的方法,其特征在于,所述根据所述特征文本,生成所述待验证文件的特征字符串包括:根据所述特征文本,通过敏感哈希simhash算法生成所述待验证文件的特征字符串。7.根据权利要求5所述的方法,其特征在于,所述根据所述所有资源文件的文件名称、文件类型和摘要信息,按照指定规则生成特征文本包括:根据所述所有资源文件的文件类型,从所述所有资源文件中获取指定摘要信息,所述指定摘要信息为指定类型资源文件的摘要信息;根据所述指定摘要信息生成所述特征文本。8.根据权利要求1所述的方法,其特征在于,所述文件摘要数据为所述待验证应用的应用图标;相应地,所述根据所述文件摘要数据,生成所述待验证文件的特征字符串包括:根据所述待验证应用的应用图标,生成所述待验证文件的特征字符串。9.根据权利要求8所述的方法,其特征在于,根据所述待验证应用的应用图标,生成所述待验证文件的特征字符串包括:根据所述待验证应用的应用图标,通过感知哈希pHash算法或尺度不变特征变换SIFT算法生成所述待验证文件的特征字符串。10.根据权利要求1所述的方法,其特征在于,所述文件摘要数据包括所述待验证应用的应用图标和所述摘要文件,相应地,所述根据所述文件摘要数据,生成所述待验证文件的特征字符串包括:根据所述待验证应用的应用图标,生成所述待验证文件的第一特征字符串;根据所述摘要文件生成特征文本,并根据所述特征文本生成所述待验证文件的第二特征字符串;根据所述第一特征字符串和所述第二特征字符串,生成所述待验证文件的特征字符串。11.根据权利要求1所述的方法,其特征在于,所述特征数据库中还存储有白名单,相应地,所述根据所述目标文件的文件信息和所述待验证文件的文件信息,对所述待验证文件进行验证包括:如果所述目标文件的文件信息与所述待验证文件的文件信息不一致,查询所述白名单中是否存储有所述待验证文件的文件信息;如果所述白名单中存储有所述待验证文件的文件信息,对所述待验证文件验证通过;如果所述白名单中未存储有所述待验证文件的文件信息,对所述待验证文件验证不通过。12.根据权利要求11所述的方法,其特征在于,所述白名单中存储有所有正版文件的文件信息。13.根据权利要求1所述的方法,其特征在于,所述根据所述目标文件的文件信息和所述待验证文件的文件信息,对所述待验证文件进行验证之后,所述方法还包括:如果所述待验证文件验证通过,将所述待验证文件的特征字符串和文件信息存储至所述特征数据库中。14.根据权利要求1所述的方法,其特征在于,所述特征数据库中还存储有多个非正版文件的文件信息、特征字符串以及所述多个正版文件和所述多个非正版文件中每个文件的验证结果,相应地,所述根据所述目标文件的文件信息和所述待验证文件的文件信息,对所述待验证文件进行验证包括:如果所述目标文件的文件信息与所述待验证文件的文件信息一致,且所述目标文件为验证通过文件,对所述待验证文件验证通过;如果所述目标文件的文件信息与所述待验证文件的文件信息一致,且所述目标文件为验证不通过文件,对所述待验证文件验证不通过。15.根据权利要求14所述的方法,其特征在于,根据所述目标文件的文件信息和所述待验证文件的文件信息,对所述待验证文件进行验证之后,所述方法还包括:将所述待验证文件的特征字符串、文件信息和验证结果存储至所述特征数据库中。16.根据权利要求14所述的方法,其特征在于,所述文件信息还包括文件名称,相应地,所述方法还包括:接收查询请求,所述查询请求至少携带待查询文件的文件名称;根据所述文件名称,从所述特征数据库中获取至少一个匹配文件的文件名称及对应验证结果;向所述查询请求的发送端反馈查询结果,所述查询结果...
【专利技术属性】
技术研发人员:黄武,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。