【技术实现步骤摘要】
本专利技术涉及计算机软件分类技术,特别是涉及一种。
技术介绍
随着移动互联网和智能终端的飞速发展,移动应用数量呈指数性增长。在智能终 端应用软件领域中,作为连接应用软件与用户的渠道-国内第三方应用市场已大量涌现, 并呈现井喷式增长的局面。国内第三方应用商店应用软件呈现繁多、混杂、虚假信息、同质 化甚至是剽窃的局面,移动应用的标识,分类,安全检测和反剽窃已成为迫切的需求。庞大 的移动应用软件量面临着标识分类管理的问题。 目前,对应用软件进行标识的方法可分为:基于描述信息的标识方法,基于消息摘 要第五版算法(Message-DigestAlgorithm5,MD5)的标识方法,基于AST的标识方法等。 其中,基于描述信息的标识方法,是根据应用开发者提供的应用名称、版本信息以 及应用描述信息,结合相应的人工审核机制,如运行应用、查看应用信息等手段,得到确认 及修正后的描述信息,作为应用的标识信息。此方法是目前使用最为广泛的软件标识方法, 几乎各大应用商城应用软件都是以此方法对应用进行类别及其他方面的标识。 基于MD5摘要的标识方法 ...
【技术保护点】
一种软件标识库的建立方法,其特征在于,包括:对于当前待提取标识的应用软件,根据本软件对各应用程序编程接口API的调用次数,确定该应用软件的API特征向量;根据所述应用软件的所述API特征向量以及当前软件标识库中的各类应用软件的API特征向量和类别信息,按照朴素贝叶斯分类算法,确定所述应用软件所属类别;将所述应用软件的所述API特征向量和所述类别,作为所述应用软件的标识信息添加到所述软件标识库中。
【技术特征摘要】
1. 一种软件标识库的建立方法,其特征在于,包括: 对于当前待提取标识的应用软件,根据本软件对各应用程序编程接口 API的调用次 数,确定该应用软件的API特征向量; 根据所述应用软件的所述API特征向量以及当前软件标识库中的各类应用软件的API 特征向量和类别信息,按照朴素贝叶斯分类算法,确定所述应用软件所属类别; 将所述应用软件的所述API特征向量和所述类别,作为所述应用软件的标识信息添加 到所述软件标识库中。2. 根据权利要求1所述的方法,其特征在于,所述确定该应用软件的API特征向量包 括: 对所述应用软件进行反编译,生成反编译代码; 根据所述反编译代码,确定该应用软件所调用的API集合APIi = {APIn,...,APIni, ...,APInJ,以及API集合中每个API的调用频率,其中,N为所述应用软 件所调用的API数量;APIni为所述应用软件所调用的第n个API,n = {1,2, .....
【专利技术属性】
技术研发人员:董枫,郭燕慧,李承泽,张程鹏,胡阳雨,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。