【技术实现步骤摘要】
数据查询方法、装置、系统、设备及存储介质
[0001]本说明书实施例涉及数据存储
,尤其涉及一种数据查询方法、装置、系统、设备及存储介质。
技术介绍
[0002]通常文件都是按照一定的格式存储的,在查询OSS(Object Storage Service:对象存储服务)上的文件时,存在一些场景,符合用户输入的查询条件的数据是多段存储地址不连续的数据。这种场景下,需要分多次从OSS设备(对象存储设备)上读取这多段数据,导致访问OSS文件的效率较低。比如,以parquet格式的文件为例,由于这类文件中连续列的数据往往存储地址也连续,不连续列的数据存储地址也不连续。在OSS上访问这类文件时,其访问数据的大体流程是:客户端会基于用户输入的查询条件确定待查询的列有哪些,然后将连续的列形成一个查询请求,并发送给对象存储服务端,以使对象存储服务端获取待查询数据。如果待查询数据是多个不连续的列,则需要多次访问文件。比如,如果一个文件有(1
‑
100)100个列,用户需查询1,3,5等奇数列,就需要发送50个查询请求,
【技术保护点】
【技术特征摘要】
1.一种数据查询方法,适用于客户端,所述客户端与对象存储服务端可基于具有数据推送功能的通信协议进行通信,所述方法包括:基于查询条件从待查询文件中确定待查询数据,并将所述待查询数据划分成数据段,其中,同一数据段中的数据的存储地址连续;生成查询请求,其中,在划分得到的数据段为至少两个数据段的情况下,所述查询请求中携带有所述至少两个数据段的标识信息,以及所述待查询文件所属对象的对象标识,其中,所述至少两个数据段中包括待请求数据段;向所述对象存储服务端发送所述查询请求,以使所述对象存储服务端基于所述标识信息以及所述对象标识获取所述至少两个数据段中的数据,将所述待请求数据段的数据,作为所述查询请求的响应结果返回给所述客户端;将所述至少两个数据段中的除所述待请求数据段的各其他数据段中的数据,作为推送数据依次推送给所述客户端。2.根据权利要求1所述的方法,所述通信协议为HTTP2.0协议。3.根据权利要求1所述的方法,所述待请求数据段基于所述至少两个数据段的标识信息在所述查询请求的排列顺序确定;或所述查询请求中还携带有用于指示所述待请求数据段的指示信息,所述待请求数据段基于所述指示信息确定。4.根据权利要求1所述的方法,所述待查询文件为按照列式格式存储的文件。5.根据权利要求4所述的方法,所述待查询文件为Parquet格式的文件,所述至少两个数据段中的每个数据段包括所述待查询文件中的一个或多个列块。6.一种数据查询方法,适用于对象存储服务端,所述对象存储服务端与客户端可基于具有数据推送功能的通信协议进行通信,所述方法包括:接收客户端发送的查询请求,所述查询请求中携带有至少两个数据段的标识信息,以及待查询文件所属对象的对象标识;其中,所述至少两个数据段通过对所述待查询文件中的待查询数据进行划分得到,同一数据段中的数据的存储地址连续,所述至少两个数据段中包括待请求数据段;针对所述待请求数据段,基于所述标识信息以及所述对象标识获取所述待请求数据段中的数据,作为所述查询请求的响应结果返回给所述客户端;针对所述至少两个数据段...
【专利技术属性】
技术研发人员:周翱,梁明旭,何振华,
申请(专利权)人:阿里巴巴中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。