一种海量数据异步存取处理方法、系统、装置和存储介质制造方法及图纸

技术编号：36081896 阅读：16 留言：0更新日期：2022-12-24 10:56

本发明专利技术涉及数据的存取处理技术领域，具体涉及一种海量数据异步存取处理方法、系统、装置和存储介质，本发明专利技术根据存储单元的分布信息和哈希值对数据进行分流，并将分流信息记录到分流数据库中并存储，其中，哈希值通过数据的特征值进行哈希计算得到；分流数据库至少包括：分流后的数据和数据存储单元的地址，根据所述哈希值查找到相应的分流数据库并获取数据，本发明专利技术的技术方案在存储数据时通过哈希值的方式对数据进行分类，并确定数据的存储位置，在获取数据库时，采用哈希值的方式获取，本发明专利技术的方案摆脱了对于PostgreSQL的依赖，对于其他数据库本发明专利技术的方案也适用。其他数据库本发明专利技术的方案也适用。其他数据库本发明专利技术的方案也适用。

全部详细技术资料下载

【技术实现步骤摘要】
一种海量数据异步存取处理方法、系统、装置和存储介质

[0001]本专利技术涉及数据的存取处理
，具体涉及一种海量数据异步存取处理方法、系统、装置和存储介质。

技术介绍

[0002]水的流动汇成江河大海，孕育生命，形成大自然生态。数据流动，推进社会进步，拓展业务边界。
[0003]目前，利用阿里云RDS PostgreSQL，HybridDB for PostgreSQL，海量对象存储OSS，打造一个从流计算到在线业务，再到数据分析和挖掘的业务，发挥数据的价值，在银行、证券交易、保险公司、游戏、电商等机构应用广泛。其中，实时数据写入采用RDS PostgreSQL，准实时数据写入采用HybridDB for PostgreSQL，但此方法需要使用定制版的PostgreSQL，无法拓展到其他类型的数据库中使用，若是在金融、政府等机构中，要求基于原系统的应用进行改造，改造成适用于Oracle数据库或者DB2数据库，这个时候就没发实现。

技术实现思路

[0004]有鉴于此，本专利技术的目的在于提供一种海量数据异步存取处理方法、系统、装置和存储介质，以解决现有技术中原系统依赖PostgreSQL，在对其进行升级改造时，无法适用于其他数据库的技术问题。
[0005]根据本专利技术实施例的第一方面，提供一种海量数据异步存取处理方法，包括：
[0006]根据存储单元的分布信息和哈希值对数据进行分流，并将分流信息记录到分流数据库中并存储；其中，所述哈希值通过数据的特征值进行哈希计算得到；所...

【技术保护点】

【技术特征摘要】
1.一种海量数据异步存取处理方法，其特征在于，包括：根据存储单元的分布信息和哈希值对数据进行分流，并将分流信息记录到分流数据库中并存储；其中，所述哈希值通过数据的特征值进行哈希计算得到；所述分流数据库至少包括：分流后的数据和数据存储单元的地址；根据所述哈希值查找到相应的分流数据库并获取数据。2.根据权利要求1所述的方法，其特征在于，所述根据存储单元的分布信息和哈希值对数据进行分流并将分流信息记录到分流数据库中并存储，包括：将结构化数据和非结构化数据进行分流后，需要将分流信息记录到分流数据库，并由异步线程推送至存储单元。3.根据权利要求2所述的方法，其特征在于，所述由异步线程推送至存储单元，包括：结构化数据通过异步线程推送至存储单元集群中的Write数据库；或者，非结构化数据通过异步线程推送至FIFO队列并按照分流规则存储在不同的存储单元。4.根据权利要求3所述的方法，其特征在于，所述结构化数据通过异步线程推送至存储单元集群中的Write数据库之后，包括：数据自动将Write数据库中的内容同步至Read数据库。5.根据权利要求3所述的方法，其特征在于，所述根据所述哈希值查找到相应的分流数据库并获取数据，包括：若获取的数据为结构化数据，根据获取数据的哈希值在分流数据库的...

【专利技术属性】
技术研发人员：肖云鹤，刘亚军，贺欢庆，代庆国，
申请(专利权)人：北京信格科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人