多源异构数据采集方法、系统、计算机设备和存储介质技术方案

技术编号:41112342 阅读:21 留言:0更新日期:2024-04-25 14:04
本发明专利技术涉及计算机技术领域,涉及一种多源异构数据库的数据采集方法、系统、装置和存储介质。其中,方法包括以下步骤:判断接入的数据源是否为单一数据源;若为单一数据源,则将数据源切分入库;若为多数据源,则对接入的数据源的数据容量进行测算,得到数据容量测算结果;获取服务器存储空间;配置多种数据缓存方法;根据所述数据容量测算结果和所述服务器存储空间,选择相应的数据缓存方法对接入的数据源进行缓存;对缓存后的源数据进行关联采集,将数据源切分入库。本申请将多种缓存方式进行融合,为接入数据源动态分配缓存方式,从而提高数据处理的实时性和高效性,且避免数据丢失。

【技术实现步骤摘要】

本专利技术涉及计算机,具体而言,涉及一种多源异构数据库的数据采集方法、系统、装置和存储介质。


技术介绍

1、数据中心建设过程中,数据采集是必不可少的一环。多源异构数据库之间关联取数情况是最常见的场景之一。要实现多源异构数据库之间的关联,首先需要将待关联的各数据源数据缓存到同一个存储中,让“多源”变成“单源”,然后再对“单源”数据进行关联采集操作,目前采用以下两种方式实现多源异构数据库之间的关联取数。第一种是基于内存的数据缓存,是将各数据源的数据分别提取到内存中,并在内存中进行缓存,再基于内存数据进行数据关联查询处理;第二种是基于磁盘的数据缓存,是将各数据源的数据分别进行提取到磁盘中,并在磁盘中以文件方式存储,再基于磁盘数据进行数据关联查询处理。上述两种多源异构数据库之间的关联取数方式存在以下几个弊端:一是基于内存的数据缓存方式对内存硬件要求极高,当缓存的数据量极大时,容易出现内存使用瓶颈,导致内存溢出而丢失数据;并且基于内存的数据缓存方式的数据持久化能力弱,在服务器断电或者读取新数据时,需要重新从异构源获取数据,既增加了网络开销,又降低了数据处理的实效性。本文档来自技高网...

【技术保护点】

1.一种多源异构数据采集方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种多源异构数据采集方法,其特征在于,

3.根据权利要求1或2所述的一种多源异构数据采集方法,其特征在于,多种数据缓存方法包括:基于内存的数据缓存方法、基于列示数据库的数据缓存方法和基于分布式文件的数据缓存方法。

4.根据权利要求3所述的一种多源异构数据采集方法,其特征在于,选择相应的数据缓存方法对接入的数据源进行缓存,包括以下步骤:

5.一种多源异构数据采集系统,其特征在于,包括:

6.根据权利要求5所述的一种多源异构数据采集系统,其特征在于,<...

【技术特征摘要】

1.一种多源异构数据采集方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种多源异构数据采集方法,其特征在于,

3.根据权利要求1或2所述的一种多源异构数据采集方法,其特征在于,多种数据缓存方法包括:基于内存的数据缓存方法、基于列示数据库的数据缓存方法和基于分布式文件的数据缓存方法。

4.根据权利要求3所述的一种多源异构数据采集方法,其特征在于,选择相应的数据缓存方法对接入的数据源进行缓存,包括以下步骤:

5.一种多源异构数据采集系统,其特征在于,包括:

6.根据权利要求5所述的一种多源异构数据采集系统,其特征在于,

...

【专利技术属性】
技术研发人员:周辉彭宏
申请(专利权)人:四川川大智胜系统集成有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1