【技术实现步骤摘要】
一种结构化数据的处理方法和分布式处理系统
本专利技术涉及计算机
,尤其涉及一种结构化数据的处理方法和分布式处理系统。
技术介绍
随着网络技术的发展,对信息的传递和处理的要求越来越高,能够用数据或统一的结构加以表示的信息,我们称之为结构化数据,如数字、符号。结构化数据有特定的字段,即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据。例如用户使用社交软件发表一条说说,具有发表标识(Identifier,ID)、时间、标题、正文等字段。现有技术中,在处理结构化数据时通常采用如下方案:客户端向数据处理系统中的逻辑层发送写请求,为了保证原子性,数据处理系统根据列表标识(ListKey)将该写请求路由至写操作队列进行排队依次写入存储层,并依次返回客户端请求写入的结果。此时,写入数据的延迟=存储层处理延迟+排队延迟。现有技术中,数据处理系统在处理结构化数据写入的时候,都是采取排队依次逐个数据写入的方式,在并发量比较大的场景下,会导致很多写请求超时以至于无法写入存储层,造成客户端写入数据失败。
技术实现思路
本专利技术实施例提供了一种结构化数据的处理方法和分布式处理系统,用于提高写请求的处理效率,降低写操作队列的排队时延。为解决上述技术问题,本专利技术实施例提供以下技术方案:第一方面,本专利技术实施例提供一种结构化数据的处理方法,包括:根据合并提交策略判断写操作队列中存储的第一写请求和第二写请求是否存在相同的写操作类型,所述第一写请求包括:待写入的第一结构化数据和对应的写操作类型,所述第二写请求包括:待写入的第二结构化数据和对应的写操作类型;若所述第一写请求 ...
【技术保护点】
1.一种结构化数据的处理方法,其特征在于,包括:根据合并提交策略判断写操作队列中存储的第一写请求和第二写请求是否存在相同的写操作类型,所述第一写请求包括:待写入的第一结构化数据和对应的写操作类型,所述第二写请求包括:待写入的第二结构化数据和对应的写操作类型;若所述第一写请求和所述第二写请求存在相同的写操作类型,将所述第一写请求和所述第二写请求合并为一个批量写请求,所述批量写请求包括:所述第一结构化数据和所述第二结构化数据;根据所述批量写请求将所述第一结构化数据和所述第二结构化数据存储到数据存储层中。
【技术特征摘要】
1.一种结构化数据的处理方法,其特征在于,包括:根据合并提交策略判断写操作队列中存储的第一写请求和第二写请求是否存在相同的写操作类型,所述第一写请求包括:待写入的第一结构化数据和对应的写操作类型,所述第二写请求包括:待写入的第二结构化数据和对应的写操作类型;若所述第一写请求和所述第二写请求存在相同的写操作类型,将所述第一写请求和所述第二写请求合并为一个批量写请求,所述批量写请求包括:所述第一结构化数据和所述第二结构化数据;根据所述批量写请求将所述第一结构化数据和所述第二结构化数据存储到数据存储层中。2.根据权利要求1所述的方法,其特征在于,所述将所述第一写请求和所述第二写请求合并为一个批量写请求,包括:从所述第一写请求中提取出所述第一结构化数据,以及从所述第二写请求中提取出所述第二结构化数据;根据所述第一结构化数据和所述第二结构化数据生成批量写请求;将所述批量写请求加入到所述写操作队列中,以及删除所述写操作队列中的所述第一写请求和所述第二写请求。3.根据权利要求1所述的方法,其特征在于,所述根据所述批量写请求将所述第一结构化数据和所述第二结构化数据存储到数据存储层中之后,所述方法还包括:获取所述批量写请求对应的批量执行结果;从所述批量执行结果中分别获取到所述第一结构化数据的存储结果、所述第二结构化数据的存储结果;向发送所述第一写请求的客户端回复所述第一结构化数据的存储结果,以及向发送所述第二写请求的客户端回复所述第二结构化数据的存储结果。4.根据权利要求1至3中任一项所述的方法,其特征在于,所述根据合并提交策略判断写操作队列中存储的第一写请求和第二写请求是否存在相同的写操作类型之前,所述方法还包括:接收客户端发送的所述第一写请求;将所述第一写请求加入到写操作队列中,并触发执行如下步骤:根据合并提交策略判断写操作队列中存储的第一写请求和第二写请求是否存在相同的写操作类型。5.根据权利要求4所述的方法,其特征在于,所述将所述第一写请求加入到写操作队列中,包括:从所述第一写请求中获取第一结构化数据以及所述第一结构化数据对应的写操作类型、业务标识、列表标识ListKey和行标识SubKey;将所述第一结构化数据以及所述第一结构化数据对应的写操作类型、对应的业务标识、ListKey和SubKey存储到所述写操作队列中的第一索引结构信息中。6.根据权利要求5所述的方法,其特征在于,所述将所述第一写请求和所述第二写请求合并为一个批量写请求之后,所述方法还包括:建立所述第一结构化数据对应的SubKey与第一链路文件描述符的第一映射关系以及所述第二结构化数据对应的SubKey与第二链路文件描述符的第二映射关系;根据所述第一映射关系和所述第二映射关系生成回包表,并将所述回包表存储到所述批量写请求中。7.一种分布式处理系统,其特征在于,包括:判断模块,用于根据合并提交策略判断写操作...
【专利技术属性】
技术研发人员:李童星,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。