【技术实现步骤摘要】
数据加载方法、装置、设备及计算机存储介质
[0001]本申请涉及计算机
,尤其涉及一种数据加载方法、装置、设备及计算机存储介质。
技术介绍
[0002]计算机
中,数据加载是指:从存储空间内读取数据的过程。在具体应用场景下,数据加载至少涉及一种存储类型的存储空间,而不同存储类型的存储空间,对数据加载效率所带来的影响也有所不同。
[0003]在传统的数据加载方法中,当业务数据被分散存储至多个本地存储空间时,数据加载设备需要基于多个存储目录才能实现业务数据的加载,使得整体的数据加载的效率较低。当业务数据被存储于云存储空间时,数据加载设备通常需要消耗较长时间从该云存储空间中确定业务数据的存储路径,以基于读取的存储路径实现业务数据的加载,进而导致数据加载效率低下。有鉴于此,如何使得数据加载效率得到有效提升便成为了当下的研究热点。
技术实现思路
[0004]本申请实施例提供了一种数据加载方法、装置、设备及计算机存储介质,可有效提升数据加载的效率。
[0005]一方面,本申请实施例提供了一种数据加载方法,包括:
[0006]接收对业务数据的数据加载请求,所述数据加载请求包括所述业务数据所在数据存储空间的存储类型;
[0007]当所述存储类型包括云存储时,从本地缓存空间中查询所述业务数据的存储路径;所述本地缓存空间中的存储路径,是通过从所述数据存储空间中确定所述业务数据的存储位置,并预先将用于指示所述存储位置的存储路径,缓存至所述本地缓存空间得到的;
[0008] ...
【技术保护点】
【技术特征摘要】
1.一种数据加载方法,其特征在于,包括:接收对业务数据的数据加载请求,所述数据加载请求包括所述业务数据所在数据存储空间的存储类型;当所述存储类型包括云存储时,从本地缓存空间中查询所述业务数据的存储路径;所述本地缓存空间中的存储路径,是通过从所述数据存储空间中确定所述业务数据的存储位置,并预先将用于指示所述存储位置的存储路径,缓存至所述本地缓存空间得到的;若成功查询到所述业务数据的存储路径,则基于查询到的存储路径,从所述数据存储空间中加载所述业务数据。2.根据权利要求1所述的方法,其特征在于,所述业务数据包括对数据处理模型进行第i轮模型优化采用的训练数据,i为大于1的整数;所述数据加载请求还包括所述业务数据的存储路径;所述方法还包括:在对数据处理模型进行第i
‑
1轮模型优化后,获取对所述数据处理模型进行第i
‑
1轮模型优化所采用的多个训练数据;遍历所述多个训练数据,并获取当前遍历的目标训练数据的数据量;当所述目标训练数据的数据量,大于所述数据存储空间的剩余存储容量时,将所述数据存储空间中存储时间最晚的训练数据删除,并将所述目标训练数据存储至所述数据存储空间;当所述目标训练数据的数据量,小于或等于所述数据存储空间的剩余存储容量时,将所述目标训练数据存储至所述数据存储空间;所述基于查询到的存储路径,从所述数据存储空间中加载所述业务数据,包括:基于所述查询到的存储路径,从所述数据存储空间中确定除所述多个训练数据以外的其他训练数据;从确定出的其他训练数据中,选取一个或多个训练数据;将选取出的一个或多个训练数据作为所述业务数据,并加载所述业务数据。3.根据权利要求1所述的方法,其特征在于,从所述数据存储空间中加载所述业务数据的方式包括:获取所述业务数据的属性信息,所述属性信息包括数据量及数据类型中的至少一种;根据所述属性信息对所述业务数据进行资源消耗量预估,得到对所述业务数据进行数据加载时所消耗的参考资源量;为所述业务数据分配数据处理资源,并采用分配的数据处理资源,从所述数据存储空间中加载所述业务数据;其中,所述数据处理资源的资源量为所述参考资源量。4.根据权利要求1所述的方法,其特征在于,将所述业务数据的存储路径缓存至所述本地缓存空间的方式包括:获取所述业务数据的数据共享类型;若所述数据共享类型指示所述业务数据为私有数据,则对所述本地缓存空间所属的处理设备进行权限验证处理;若对所述处理设备的权限验证通过,则从所述数据存储空间中确定所述业务数据的存储位置;获取用于指示所述存储位置的存储路径,并将获取到的存储路径缓存至所述本地缓存
空间。5.一种数据加载方法,其特征在于,包括:接收对业务数据的数据加载请求,所述数据加载请求包括所述业务数据所在数据存储空间的存储类型;当所述存储类型包括本地存储时,从本地缓存空间中查询所述业务数据的存储目录,所述存储目录用于指示所述业务数据所在的多个数据存储空间所映射的逻辑存储空间;其中,一个存储目录用于指示一个逻辑存储空间,一个逻辑存储空间映射至少两个数据存储空间;若成功查询到所述业务数据的存储目录,则从所述存储目录指示的逻辑存储空间所映射的多个数据存储空间中,加载所述业务数据的数据片段;对加载的各个数据片段进行组合,得到所述业务数据。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:响应于所述业务数据的数据存储请求,获取所述业务数据的数据量,以及N个数据存储空间中每个数据存储空间的剩余存储容量,N为大于1的整数;若所述业务数据的数据量大于所述每个数据存储空间的剩余存储容量,则从所述N个数据存储空间中选取多个数据存储空间;其中,选取的多个数据存储空间的剩余存储容量总和大于或者等于所述业务数据的数据量;将选取的多个数据存储空间进行存储资源整合,得到所述选取的多个数据存储空间所映射的逻辑存储空间;对所述业务数据进行分片,得到所述业务数据的多个数据片段,并将所述多个数据片段存储至所述选取的多个数据...
【专利技术属性】
技术研发人员:查冲,
申请(专利权)人:深圳市腾讯计算机系统有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。