数据存储及读取的方法、装置、设备及介质制造方法及图纸

技术编号:32571669 阅读:20 留言:0更新日期:2022-03-09 16:59
本发明专利技术公开了一种数据存储及读取的方法,包括步骤:对文章数据进行分类,获取文章数据的第一信息和第二信息;将所述第一信息加入Kafka消息队列,并在所述Kafka消息队列消费所述第一信息后,将所述第一信息存储到第一服务器中;将所述第二信息分别存储到第二服务器的不同数据表中,并在对所述第二信息加上样式序列化数据后,生成第三信息并存储到第三服务器中;按照设定的时间阈值,分别完成所述第二服务器与第一服务器、第三服务器中存储数据的一致性比对;依据不同的应用程序接口从所述第一服务器中获取第一信息,或,从第二服务器中获取第二信息,或,从第三服务器中获取第三信息。本申请可以实现文章数据的安全存储,并提供高效的文章数据查询。效的文章数据查询。效的文章数据查询。

【技术实现步骤摘要】
数据存储及读取的方法、装置、设备及介质


[0001]本专利技术涉及互联网
,尤其是一种数据存储及读取的方法、装置、电子设备及存储介质。

技术介绍

[0002]互联网文章越来越多,内容越来越丰富,要求相关服务器既能将文章数据稳定的存储,又能将文章信息快速准确的提供给搜索用户,现有技术的服务器一般都是将互联网文章直接存储到数据库中,给用户提供数据端口,由用户直接从数据库中读取相应的文章数据,这种方式对于小访问量而言可以应对,但是对于大用户量同时访问时,容易引起服务器宕机。
[0003]对于此种问题,现有技术一般采用使用不同的数据库类型,以提高数据访问量和数据存储的安全性,但是这种方法能够提升的空间比较小,不能从本质上改变服务器宕机问题,另一种技术是将部分信息存储到缓存中,以提高用户访问文章数据的效率,但是这种方式的时间效率比较差,随着互联网文章的增多,内存的占用率将变大,同样会影响计算机的处理速度。
[0004]因此,需要一种能够通过改变文章数据的存储方式,能够保证文章数据存储的稳定性,同时提高用户快速访问、检索文章信息的流畅性,不会发生宕机现象。

技术实现思路

[0005]为此,本专利技术提供了一种数据存储及读取的方法、装置、电子设备及存储介质,以力图解决或者至少缓解上面存在的至少一个问题。
[0006]根据本专利技术的一个方面,提供了一种数据存储及读取的方法,该方法将文章数据的摘要信息和全文信息分别存储到不同的服务器中,实现文章数据的稳定存储和快速读取,所述方法包括步骤:
[0007]对文章数据进行分类,获取文章数据的第一信息和第二信息,所述第一信息为所述文章数据的摘要信息,所述第二信息为所述文章数据的全文信息;依据所述第一信息,将所述第一信息加入Kafka消息队列,并在所述Kafka消息队列消费所述第一信息后,将所述第一信息存储到第一服务器中,所述第一服务器为搜索服务器ElasticSearch;依据所述第二信息的不同用途,将所述第二信息分别存储到第二服务器的不同数据表中,并在对所述第二服务器的不同数据表中的所述第二信息加上样式序列化数据后,生成第三信息并存储到第三服务器中,所述第二服务器为双活集群的数据服务器SqlServer集群,所述第三服务器为数据服务器HBase;按照设定的时间阈值,分别完成所述第一服务器与第二服务器、第二服务器与第三服务器中存储数据的一致性比对;依据不同的应用程序接口从所述第一服务器中获取第一信息,或,从第二服务器中获取第二信息,或,从第三服务器中获取第三信息。
[0008]可选地,所述对文章数据进行分类,获取文章数据的第一信息和第二信息的步骤
包括:获取商家发布的文章数据,所述文章数据包括文章标题、摘要文字信息、内容文字信息、图片信息、文章序列号、商家序列号、文章数据有效时间信息;依据所述商家发布的文章数据,获取所述文章数据中的第一信息和第二信息,所述第一信息为文章数据的摘要信息,所述摘要信息包括:文章序列号、摘要文字信息、图片信息中的第一幅图片、商家序列号、文章数据有效时间信息,所述第二信息为文章数据的全文信息,所述全文信息包括:文章标题、内容文字信息、图片信息、文章序列号、商家序列号、文章数据有效时间信息。
[0009]可选地,所述依据所述第一信息,将所述第一信息加入Kafka消息队列,并在所述Kafka消息队列消费所述第一信息后,将所述第一信息存储到第一服务器中的步骤包括:将所述第一信息加入Kafka消息队列,获取所述Kafka消息队列的第一信息进程列表;依据所述Kafka消息队列的第一信息进程列表,获取所述Kafka消息队列的第一信息进程列表被消费的监听信息;依据所述Kafka消息队列的第一信息进程列表被消费的监听信息,获取被消费的所述第一信息的数据格式变换成所述第一服务器的数据存储格式,并将被消费的所述第一信息存储到所述第一服务器中,所述第一服务器为搜索服务器ElasticSearch。
[0010]可选地,所述依据所述第一信息,将所述第一信息加入Kafka消息队列,并在所述Kafka消息队列消费所述第一信息后,将所述第一信息存储到第一服务器中的步骤还包括:将所述第一服务器中存储的一个或多个第一信息加入Kafka消息队列,获取所述Kafka消息队列的第一信息进程列表;依据所述Kafka消息队列的第一信息进程列表,获取所述Kafka消息队列的第一信息进程列表被消费的监听信息;依据所述Kafka消息队列的第一信息进程列表被消费的监听信息,所述第一服务器中更新被消费的所述第一信息。
[0011]可选地,所述依据所述第二信息的不同用途,将所述第二信息分别存储到第二服务器的不同数据表中,并在对所述第二服务器的不同数据表中的所述第二信息加上样式序列化数据后,生成第三数据并存储到第三服务器中的步骤包括:获取所述第二信息连接的全部应用程序接口及每个所述应用程序接口在所述第二服务器的数据表;依据所述第二信息连接的全部应用程序接口及每个所述应用程序接口在所述第二服务器的数据表,将所述第二信息分别存储到与所述应用程序接口相适应的第二服务器的数据表中;依据所述每一个应用程序接口在所述第二服务器的数据表中存储的第二信息,将所述第二信息加上样式序列化数据,获取第三信息,所述第三信息与对应的应用程序接口的数据格式相适应;将所述第三信息存储到所述应用程序接口对应的第三服务器中。
[0012]可选地,所述第二服务器为双活集群的数据服务器SqlServer集群,所述双活集群的数据服务器SqlServer集群为分别部署于两个地域的两套数据服务器SqlServer集群,所述两套数据服务器SqlServer集群同时存储第二信息,所述两套数据服务器SqlServer集群中,第一套数据服务器SqlServer集群为生产集群,用于提供数据读写服务,第二套数据服务器SqlServer集群为备份集群,用于在所述第一套数据服务器SqlServer集群故障时,接替所述第一套数据服务器SqlServer集群的数据读取服务;所述两套数据服务器SqlServer集群为主从模式,包括一个主服务器和多个从服务器,所述主服务器提供写数据操作,用于将第二信息写入到所述第二服务器,所述从服务器提供读数据操作,用于从所述第二服务器中读取第二信息。
[0013]可选地,所述第一服务器与第二服务器中存储数据的一致性比对的步骤包括:更新所述第一服务器中存储的第一信息,及第二服务器中存储的第二信息;分别从所述第一
服务器中获取第一信息,从第二服务器中获取第二信息;判断所述第二信息是否存在对应的第一信息;如果否,则在所述第一服务器中写入或删除与所述第二信息不对应存在的第一信息。
[0014]可选地,所述第二服务器与第三服务器中存储数据的一致性比对的步骤包括:更新所述第二服务器中存储的第二信息,以及所述第三服务器中存储的第三信息;设置时间戳,获取时间戳范围内的设定数量的第二服务器中的第二信息,以及第三服务器中的第三信息;判断所述第二信息是否存在对应的第三信息;如果否,则在所述第三服本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据存储及读取的方法,所述方法通过将文章数据的摘要信息和全文信息分别存储到不同的服务器中,实现文章数据的稳定存储和快速读取,所述方法包括步骤:对文章数据进行分类,获取文章数据的第一信息和第二信息,所述第一信息为所述文章数据的摘要信息,所述第二信息为所述文章数据的全文信息;依据所述第一信息,将所述第一信息加入Kafka消息队列,并在所述Kafka消息队列消费所述第一信息后,将所述第一信息存储到第一服务器中,所述第一服务器为搜索服务器ElasticSearch;依据所述第二信息的不同用途,将所述第二信息分别存储到第二服务器的不同数据表中,并在对所述第二服务器的不同数据表中的所述第二信息加上样式序列化数据后,生成第三信息并存储到第三服务器中,所述第二服务器为双活集群的数据服务器SqlServer集群,所述第三服务器为数据服务器HBase;按照设定的时间阈值,分别完成所述第一服务器与第二服务器、第二服务器与第三服务器中存储数据的一致性比对;依据不同的应用程序接口从所述第一服务器中获取第一信息,或,从第二服务器中获取第二信息,或,从第三服务器中获取第三信息。2.如权利要求1所述的方法,其中,所述对文章数据进行分类,获取文章数据的第一信息和第二信息的步骤包括:获取商家发布的文章数据,所述文章数据包括文章标题、摘要文字信息、内容文字信息、图片信息、文章序列号、商家序列号、文章数据有效时间信息;依据所述商家发布的文章数据,获取所述文章数据中的第一信息和第二信息,所述第一信息为文章数据的摘要信息,所述摘要信息包括:文章序列号、摘要文字信息、图片信息中的第一幅图片、商家序列号、文章数据有效时间信息,所述第二信息为文章数据的全文信息,所述全文信息包括:文章标题、内容文字信息、图片信息、文章序列号、商家序列号、文章数据有效时间信息。3.如权利要求1所述的方法,其中,所述依据所述第一信息,将所述第一信息加入Kafka消息队列,并在所述Kafka消息队列消费所述第一信息后,将所述第一信息存储到第一服务器中的步骤包括:将所述第一信息加入Kafka消息队列,获取所述Kafka消息队列的第一信息进程列表;依据所述Kafka消息队列的第一信息进程列表,获取所述Kafka消息队列的第一信息进程列表被消费的监听信息;依据所述Kafka消息队列的第一信息进程列表被消费的监听信息,获取被消费的所述第一信息的数据格式变换成所述第一服务器的数据存储格式,并将被消费的所述第一信息存储到所述第一服务器中,所述第一服务器为搜索服务器ElasticSearch。4.如权利要求3所述的方法,其中,所述依据所述第一信息,将所述第一信息加入Kafka消息队列,并在所述Kafka消息队列消费所述第一信息后,将所述第一信息存储到第一服务器中的步骤还包括:将所述第一服务器中存储的一个或多个第一信息加入Kafka消息队列,获取所述Kafka消息队列的第一信息进程列表;依据所述Kafka消息队列的第一信息进程列表,获取所述Kafka消息队列的第一信息进
程列表被消费的监听信息;依据所述Kafka消息队列的第一信息进程列表被消费的监听信息,所述第一服务器中更新被消费的所述第一信息。5.如权利要求1所述的方法,其中,所述依据所述第二信息的不同用途,将所述第二信息分别存储到第二服务器的不同数据表中,并在对所述第二服务器的不同数据表中的所述第二信息加上样式序列化数据后,生成第三数据并存储到第三服务器中的步骤包括:获取所述第二信息连接的全部应用程序接口及每个所述应用程序接口在所述第二服务器的数据表...

【专利技术属性】
技术研发人员:曹磊
申请(专利权)人:北京皮尔布莱尼软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1