【技术实现步骤摘要】
基于多种数据库与文件系统的软件样本混合存储系统
本专利技术主要涉及软件存储
,具体地说,涉及一种基于多种数据库与文件系统的软件样本混合存储系统。
技术介绍
海量的软件样本及其特征是实现软件盗版检测、恶意软件检测、漏洞检测等同源性分析(软件同源性分析可理解为不同的软件代码是否源自同一套软件代码或是否由同一个作者、团队编写,其是否具有内在关联性、相似性)的基础,由于软件样本与特征具有数据属性多、类型杂等特点,既有结构性数据,如元数据,也有非结构数据,如属性值,也有图数据,如关联关系数据,既有文件类型也有数据库类型数据,现有的单一种类数据库、文件系统或有限混合类型存储方案均存在海量软件样本特性数据入库与检索效率低、数据存储与管理困难、数据服务扩展性差和无法满足多用户获取实时请求数据的问题。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种基于多种数据库与文件系统的软件样本混合存储系统,可解决现有技术海量软件样本特性数据入库与检索效率低、数据存储与管理困难、数据服务扩展性差和无法满足多用户获取实时请求数 ...
【技术保护点】
1.基于多种数据库与文件系统的软件样本混合存储系统,其特征在于,包括缓存模块、检索模块、分布式文件存储系统和数据库系统,所述缓存模块和检索模块连接,所述分布式文件存储系统用于存储文本信息,其中,所述数据库系统包括并排设置的关系型数据库、分布式非关系型数据库和图数据库,所述关系型数据库用于存储结构性数据,所述分布式非关系型数据库用于存储从软件样本提取的指纹特征信息,所述图数据库用于存储关联关系数据,所述检索模块分别与分布式文件存储系统、关系型数据库、分布式非关系型数据库和图数据库连接。/n
【技术特征摘要】
1.基于多种数据库与文件系统的软件样本混合存储系统,其特征在于,包括缓存模块、检索模块、分布式文件存储系统和数据库系统,所述缓存模块和检索模块连接,所述分布式文件存储系统用于存储文本信息,其中,所述数据库系统包括并排设置的关系型数据库、分布式非关系型数据库和图数据库,所述关系型数据库用于存储结构性数据,所述分布式非关系型数据库用于存储从软件样本提取的指纹特征信息,所述图数据库用于存储关联关系数据,所述检索模块分别与分布式文件存储系统、关系型数据库、分布式非关系型数据库和图数据库连接。
2.根据权利要求1所述的基于多种数据库与文件系统的软件样本混合存储系统,其特征在于,所述分布式文件存储系统采用HDFS分布式文件系统,所述HDFS分布式文件系统与图数据库、分布式非关系型数据库和关系型数据库从右至左依次并排设置。
3.根据权利要求2所述的基于多种数据库与文件系统的软件样本混合存储系统,其特征在于,所述检索模块使用Elasticsearch建立高效检索机制,用于实现对分布式文件存储系统与数据库系统的数据快速查询。
4.根据权利要求3所述的基于多种数据库与文件系统的软件样本混合存储系统,其特征在于,所述缓存模块为Redis缓存数据库,用于提高检索效率,减少响应时间...
【专利技术属性】
技术研发人员:肖哲锋,
申请(专利权)人:湖南泛联新安信息科技有限公司,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。