【技术实现步骤摘要】
数据加载方法、装置及存储介质、计算设备、计算系统
本专利技术涉及互联网
,尤其涉及一种数据加载方法、装置及存储介质、计算设备、计算系统。
技术介绍
为了应对海量数据的处理任务,分布式系统应用而生。在由众多计算设备构成的分布式计算集群中,每个计算设备每次可以从存储有海量数据的外部存储系统中读取一些数据并进行数据计算处理。另外,随着数据集规模的增加,海量的数据可以采用Hadoop分布式文件系统(HadoopDistributedFileSystem,简称HDFS)、对象存储(ObjectStorageService,简称OSS)系统等存储系统进行存储。上述计算集群中的各计算设备每次加载数据的时候,都需要通过网络端口访问远程的存储系统以加载其中存储的数据。在数据加载过程中,由于网络端口的吞吐有限,会造成输入输出(IO)瓶颈,使得数据加载的延迟较大。
技术实现思路
本专利技术实施例提供一种数据加载方法、装置及存储介质、计算设备、计算系统,用以提高数据加载速度。第一方面,本专利技术实施例提供一种数据加载方法,应用于计算集群中的目标计算设备,所述目标计算设备是所述计算集群中任一个计算设备,所述方法包括:将从外部存储系统中获取的数据存入到所述目标计算设备的内存空间中,所述内存空间被设置为支持以远程直接数据存取方式访问的模式,以得到由所述计算集群中各计算设备中处于所述模式的内存空间构成的分布式内存系统;响应于所述目标计算设备中用于执行数据计算任务的目标进程触发的数据加 ...
【技术保护点】
1.一种数据加载方法,其特征在于,应用于计算集群中的目标计算设备,所述目标计算设备是所述计算集群中任一个计算设备,所述方法包括:/n将从外部存储系统中获取的数据存入到所述目标计算设备的内存空间中,所述内存空间被设置为支持以远程直接数据存取方式访问的模式,以得到由所述计算集群中各计算设备中处于所述模式的内存空间构成的分布式内存系统;/n响应于所述目标计算设备中用于执行数据计算任务的目标进程触发的数据加载请求,将所述目标计算设备中的目标存储空间设置为支持以远程直接数据存取方式访问的模式;/n确定与所述数据加载请求对应的需加载数据在所述分布式内存系统中的存储地址,根据所述存储地址从所述分布式内存系统中加载所述需加载数据到所述目标存储空间中,以使所述目标进程从所述目标存储空间中读取所述需加载数据。/n
【技术特征摘要】 【专利技术属性】
1.一种数据加载方法,其特征在于,应用于计算集群中的目标计算设备,所述目标计算设备是所述计算集群中任一个计算设备,所述方法包括:
将从外部存储系统中获取的数据存入到所述目标计算设备的内存空间中,所述内存空间被设置为支持以远程直接数据存取方式访问的模式,以得到由所述计算集群中各计算设备中处于所述模式的内存空间构成的分布式内存系统;
响应于所述目标计算设备中用于执行数据计算任务的目标进程触发的数据加载请求,将所述目标计算设备中的目标存储空间设置为支持以远程直接数据存取方式访问的模式;
确定与所述数据加载请求对应的需加载数据在所述分布式内存系统中的存储地址,根据所述存储地址从所述分布式内存系统中加载所述需加载数据到所述目标存储空间中,以使所述目标进程从所述目标存储空间中读取所述需加载数据。
2.根据权利要求1所述的方法,其特征在于,所述数据加载请求中包括需加载的数据量和目标计算单元对应的存储部件;
其中,所述目标存储空间位于所述目标计算单元对应的存储部件中,所述需加载数据是与所述需加载的数据量对应的数据。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
存储用户通过配置接口输入的配置信息,以根据所述配置信息生成所述数据加载请求,所述配置信息包括所述需加载的数据量和所述目标计算单元对应的存储部件。
4.根据权利要求2所述的方法,其特征在于,所述目标计算单元对应的存储部件包括如下任一种:中央处理器对应的内存、图形处理器对应的显存。
5.根据权利要求1所述的方法,其特征在于,所述确定与所述数据加载请求对应的需加载数据在所述分布式内存系统中的存储地址,包括:
获取数据存储记录,所述数据存储记录中描述了数据标识与数据在分布式内存系统中的存储地址之间的对应关系;
根据所述数据存储记录确定需加载数据在所述分布式内存系统中的存储地址。
6.根据权利要求1所述的方法,其特征在于,所述数据计算任务包括:模型训练任务,所述数据包括:模型的训练数据。
7.一种数据加载装置,其特征在于,位于计算集群中的目标计算设备,所述目标计算设备是所述计算集群中任一个计算设备,所述装置包括:
缓存模块,用于将从外部存储系统中获取的数据存入到所述目标计算设备的内存空间中,所述内存空间被设置为支持以远程直接数据存取方式访问的模式,以得到由所述计算集群中各计算设备中处于所述模式的内存空间构成的分布式内存系统;
技术研发人员:刘小丽,董建波,李豪,曹政,
申请(专利权)人:阿里云计算有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。