训练样本读取方法及装置制造方法及图纸

技术编号：26890158 阅读：24 留言：0更新日期：2020-12-29 16:05

本申请提供一种训练样本读取方法，方法包括：针对待训练模型的每次训练，判断本地存储介质中是否存储有待训练模型所需的训练样本；若否，则从分布式存储设备中读取待训练模型所需的训练样本以对待训练模型进行本次训练，并将读取到的训练样本存储至本地存储介质；若是，则从本地存储介质中读取待训练模型所需的训练样本以用于对待训练模型进行本次训练。在模型训练过程中，通过将训练样本存储在本地，从而后续每次都可从本地读取，无需与分布式存储设备交互，使得相同硬件规格的分布式存储设备可支撑更多的训练任务。又由于从本地读取相对从外界读取的速度快很多，因此模型训练效率也高，同时还使得训练设备的存储资源在训练过程中得到有效利用。

全部详细技术资料下载

【技术实现步骤摘要】
训练样本读取方法及装置
本申请涉及计算机
，尤其涉及一种训练样本读取方法及装置。
技术介绍
当前大规模训练系统由云管理平台、训练设备以及分布式存储设备三部分构成，当用户向云管理平台请求训练任务时，云管理平台将训练任务调度分配给其中的一台训练设备，该训练设备基于接收的训练任务进行模型训练，在训练过程中，需要从分布式存储设备反复多次读取某一样本集中的训练样本进行多次训练，因此分布式设备与训练设备之间的数据吞吐量大。当有大量用户同时向云管理平台请求训练任务时，处理不同训练任务的训练设备会同时从分布式存储设备读取训练样本。然而，分布式存储设备与训练设备之间的网络带宽是固定的，因此分布式存储设备很容易达到瓶颈，影响训练样本的读取速度，降低模型训练效率。
技术实现思路
有鉴于此，本申请提供一种训练样本读取方法及装置，以解决训练样本读取速度慢，模型训练效率低的问题。根据本申请实施例的第一方面，提供一种训练样本读取方法，所述方法应用于训练设备，所述方法包括：针对待训练模型的每次训练，判断本地存储介质中是否存储有待训练模型所需的训练样本；若所述本地存储介质中没有待训练模型所需的训练样本，则从分布式存储设备中读取待训练模型所需的训练样本以对待训练模型进行本次训练，并将读取到的训练样本存储至本地存储介质；若待训练模型所需的训练样本已存储在所述本地存储介质，则从所述本地存储介质中读取待训练模型所需的训练样本以用于对待训练模型进行本次训练。根据本申请实施例的第二方面，提供一种训...

【技术保护点】
1.一种训练样本读取方法，所述方法应用于训练设备，其特征在于，所述方法包括：/n针对待训练模型的每次训练，判断本地存储介质中是否存储有待训练模型所需的训练样本；/n若所述本地存储介质中没有待训练模型所需的训练样本，则从分布式存储设备中读取待训练模型所需的训练样本以对待训练模型进行本次训练，并将读取到的训练样本存储至本地存储介质；/n若待训练模型所需的训练样本已存储在所述本地存储介质，则从所述本地存储介质中读取待训练模型所需的训练样本以用于对待训练模型进行本次训练。/n

【技术特征摘要】
1.一种训练样本读取方法，所述方法应用于训练设备，其特征在于，所述方法包括：
针对待训练模型的每次训练，判断本地存储介质中是否存储有待训练模型所需的训练样本；
若所述本地存储介质中没有待训练模型所需的训练样本，则从分布式存储设备中读取待训练模型所需的训练样本以对待训练模型进行本次训练，并将读取到的训练样本存储至本地存储介质；
若待训练模型所需的训练样本已存储在所述本地存储介质，则从所述本地存储介质中读取待训练模型所需的训练样本以用于对待训练模型进行本次训练。

2.根据权利要求1所述的方法，其特征在于，从分布式存储设备中读取待训练模型所需的训练样本以对待训练模型进行本次训练，包括：
获取所述待训练模型所需样本集包含的每条训练样本的访问路径；
从分布式存储设备中读取每条访问路径上的训练样本以对待训练模型进行本次训练。

3.根据权利要求2所述的方法，其特征在于，所述本地存储介质包括内存和磁盘；
将读取到的训练样本存储至本地存储介质，包括：
针对读取到的每条训练样本，若内存中剩余空间大于第一预设阈值，则将该训练样本存储至内存；
若内存中剩余空间小于第一预设阈值且磁盘中剩余空间大于第二预设阈值，则将该训练样本存储至磁盘；
若内存中剩余空间小于第一预设阈值且磁盘中剩余空间小于第二预设阈值，则停止存储。

4.根据权利要求3所述的方法，其特征在于，在将读取到的训练样本存储至内存或磁盘之后，所述方法还包括：
针对存储至内存或磁盘中的每条训练样本，为该训练样本生成存储路径和状态标识，并利用所述存储路径更新该训练样本的访问路径，并对应更新后的访问路径记录所述状态标识，所述状态标识用于指示训练样本存储至内存还是磁盘；
判断本地存储介质中是否存储有待训练模型所需的训练样本，包括：
判断待训练模型所需样本集包含的访问路径中是否存在记录有状态标识的访问路径；
若存在，则确定本地存储介质中存储有待训练模型所需的训练样本；
若不存在，则确定本地存储介质中没有待训练模型所需的训练样本。

5.根据权利要求4所述的方法，其特征在于，从本地存储介质中读取待训练模型所需的训练样本，包括：
从所述待训练模型所需样本集中获取记录有状态标识的访问路径；
针对每条记录有状态标识的访问路径，若该访问路径的状态标识指示存储至内存，则从内存中读取该访问路径上的训练样本；若该访问路径的状态标识指示存储至磁盘，则从磁盘中读取该访问路径上的训练样本。

6.根据权利要求4所述的方法，其特征在于，在从本地存储介质中读取待训练模型所需的训练样本之后，若所述待训练模型所需样本集中存在未记录状态标识的访问路径，所述方法还包括：
从分布式存储设备中读取未记录状态标识的访问路径上的训练样本；
利用从本地存储介质中读取的训练样本和从分布式存储设备中读取的训练样本对待训练模型进行本次训练。

7.一种训练样本读取装置，所述装置应用于训练设备，其特征在于，所述装置包括：...

【专利技术属性】
技术研发人员：姚沛，杨威，戚玉青，
申请(专利权)人：杭州海康威视数字技术股份有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人