【技术实现步骤摘要】
信息处理方法和装置、存储介质及电子设备
[0001]本专利技术涉及地图交通领域,具体而言,涉及一种信息处理方法和装置、存储介质及电子设备。
技术介绍
[0002]随着越来越多的AI(Artificial Intelligence,人工智能)应用进入生产应用阶段,目前,可以利用AI执行一些推理任务。
[0003]其中,AI设备执行推理任务大多采用的方式为:向一台AI设备输入推理任务对应的推理信息,AI设备对输入的推理信息进行处理,输出对应的结果,但是上述过程中,AI设备的处理能力是固定的,在推理任务繁重时,AI设备的处理能力不足,导致对推理任务的处理效率较低,此外,在推理任务较为简单时,AI设备的处理能力过剩,导致对AI设备中的资源造成了浪费。
[0004]针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
[0005]本专利技术实施例提供了一种信息处理方法和装置、存储介质及电子设备,以至少解决信息处理过程中,待处理信息的数量与用于处理的设备的匹配度较低的技术问题。
[0006] ...
【技术保护点】
【技术特征摘要】
1.一种信息处理方法,其特征在于,包括:在待处理信息队列中的待处理信息的数量满足预设的第一扩容条件、且当前将M个设备配置为用于对所述待处理信息队列中的待处理信息执行处理操作的情况下,将新增的N个设备配置为用于对所述待处理信息队列中的待处理信息执行处理操作,其中,N为大于或等于1的正整数,M为大于或等于1的正整数,所述M个设备对所述待处理信息队列中的各个待处理信息执行所述处理操作所消耗的第一预估时长大于第一处理时长阈值;从所述待处理信息队列中获取N组待处理信息,并将所述N组待处理信息输入到所述N个设备中,其中,所述N组待处理信息与所述N个设备一一对应,所述M个设备和所述N个设备对所述待处理信息队列中的各个待处理信息执行所述处理操作所消耗的第二预估时长小于或等于所述第一处理时长阈值;在使用所述M个设备对所述待处理信息队列中的待处理信息执行处理操作的情况下,使用所述N个设备中的各个设备对对应的一组待处理信息执行所述处理操作,共得到N组处理结果,其中,所述N个设备和所述M个设备是并行执行所述处理操作的设备。2.根据权利要求1所述的方法,其特征在于,所述在待处理信息队列中的待处理信息的数量满足预设的第一扩容条件、且当前将M个设备配置为用于对所述待处理信息队列中的待处理信息执行处理操作的情况下,将新增的N个设备配置为用于对所述待处理信息队列中的待处理信息执行处理操作,包括:在所述待处理信息队列中的待处理信息的数量大于或等于预设的第一数量阈值、且当前将所述M个设备配置为用于对所述待处理信息队列中的待处理信息执行处理操作的情况下,将新增的所述N个设备配置为用于对所述待处理信息队列中的待处理信息执行处理操作;或者在所述待处理信息队列中的待处理信息的数量的增长速率大于或等于预设的第一速率阈值、且当前将所述M个设备配置为用于对所述待处理信息队列中的待处理信息执行处理操作的情况下,将新增的所述N个设备配置为用于对所述待处理信息队列中的待处理信息执行处理操作。3.根据权利要求2所述的方法,其特征在于,所述将新增的所述N个设备配置为用于对所述待处理信息队列中的待处理信息执行处理操作,包括:根据所述待处理信息队列中的待处理信息的数量与预设的所述第一处理时长阈值,确定N的取值,并将新增的所述N个设备配置为用于对所述待处理信息队列中的待处理信息执行处理操作。4.根据权利要求1所述的方法,其特征在于,所述使用所述N个设备中的各个设备对对应的一组待处理信息执行所述处理操作,包括:通过以下步骤使用所述N个设备中的第i个设备对第i组待处理信息执行所述处理操作,其中,i为大于或等于1、且小于或等于N的正整数:通过所述第i个设备中的中央处理器CPU分对所述第i组待处理信息中的各待处理信息执行预处理操作,得到对应的预处理信息,并将所述预处理信息输入所述第i个设备中的图形处理器GPU,通过所述GPU使用目标信息处理模型对所述预处理信息执行所述处理操作,得到对应的处理结果,其中,所述预处理操作与所述处理操作是异步执行的操作。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述待处理信息队列中的待处理信息的数量满足预设的第一缩容条件、且当前将M个设备配置为用于对所述待处理信息队列中的待处理信息执行处理操作的情况下,将当前使用的所述M个设备减少至P个设备,其中,P为大于或等于1、且小于M的正整数,所述P个设备被设置为对所述待处理信息队列中的待处理信息执行处理操作,所述M个设备中除所述P个设备之外的设备被设置为停止对所述待处理信息队列中的待处理信息执行处理操作,所述M个设备对所述待处理信息队列中的各个待处理信息执行所述处理操作所消耗的第三预估时长小于第二处理时长阈值,所述第二处理时长阈值小于所述第一处理时长阈值;从所述待处理信息队列中获取P组待处理信息,并将所述P组待处理信息输入到所述P个设备中,其中,所述P组待处理信息与所述P个设备一一对应,所述P个设备对所述待处理信息队列中的各个待处理信息执行所述处理操作所消耗的第四预估时长大于或等于所述第二处理时长阈值、且小于或等于所述第一处理时长阈值;使用所述P个设备中的各个设备对对应的一组待处理信息执行所述处理操作,共得到P组处理结果,其中,所述P个设备中的各个设备是并行执行所述处理操作的设备。6.根据权利要求5所述的方法,其特征在于,所述在所述待处理信息队列中的待处理信息的数量满足预设的第一缩容条件、且当前将M个设备配置为用于对所述待处理信息队列中的待处理信息执行处理操作的情况下,将当前使用的所述M个设备减少至P个设备,包括:在所述待处理信息队列中的待处理信息的数量小于或等于预设的第二数量阈值、且当前将所述M个设备配置为用于对所述待处理信息队列中的待处理信息执行处理操作的情况下,将当前使用的所述M个设备减少至所述P个设备;或者在所述待处理信息队列中的待处理信息的数量的下降速率大于或等于预设的第二速率阈值、且当前将所述M个设备配置为用于对所述待处理信息队列中的待处理信息执行处理操作的情况下,将当前使用的所述M个设备减少至所述P个设备。7.根据权利要求6所述的方法,其特征在于,所述将当前使用的所述M个设备减少至所述P个设备,包括:根据所述待处理信息队列中的待处理信息的数量与预设的第二处理时长阈值,确定P的取值,并将当前使用的所述M个设备减少至所述P个设备。8.根据权利要求5所述的方法,其特征在于,所述使用所述P个设备中的各个设备对对应的一组待处理信息执行所述处理操作,包括:通过以下步骤使用所述P个设备中的第j个设备对第j组待处理信息执行所述处理操作,其中,j为大于或等于1、且小于或等于P的正整数:通过所述第j个设备中的中央处理器CPU分对所述第j组待处理信息中的各待处理信息执行预处理操作,得到对应的预处理信息,并将所述预处理信息输入所述第j个设备中的图形处理器GPU,通过所述GPU使用目标信息处理模型对所述预处理信息执行所述处理操作,得到对应的处理结果,其中,所述预处理操作与所述处理操作是异步执行的操作。9.根据权利要求4或8所述的方法,其特征在于,所述方法还包括:使用待处理样本信息集合对待训练的信息处理模型进行Q轮训练,得到所述目标信息处理模型,其中,第i轮训练中使用的配置有第i
‑
1轮训练得到的信息处理模型的设备的数量与所述第i轮训练中使用的待处理样本信息的数量对应,Q为大于或等于2的正整数,i为大于或等于2、且小于或等于Q的正整数,所述第i轮训练中使用的设备被设置为使用所述第
i
‑
1轮训练得到的信息处理模型对所述第i轮训练中使用的待处理样本信息执行所述处理操作。10.根据权利要求9所述的方法,其特征在于,使用待处理样本信息集合对待训练的信息处理模型进行Q轮训练,得到所述目标信息处理模型,包括:通过以下步骤进行所述第i轮训练:在所述第i轮训练中使用的待处理样本信息的数量满足预设的第二扩容条件、且所述第i
‑
1轮训练中使用的设备为M
i
‑1个设备的情况下,增加用于所述第i轮训练的N
i
个设备,其中,M
i
‑1为大于或等于1的正整数,N
i
为大于或等于1的正整数,所述M
i
‑1个设备和所述N
i
个设备中的各个设备配置有所述第i
‑
1轮训练得到的信息处理模型,所述M
i
‑1个设备和所述N
i
个设备被设置为在所述第i轮训练中使用所述第i
‑
1轮训练得到的信息处理模型对所述第i轮训练中使用的待处理样本信息执行所述处理操作;将所述第i轮训练中使用的待处理样本信息分成(M
i
‑1+N
i
)组待处理样本信息,并将所述(M
i
‑1+N
i
)组待处理样本信息输入到所述M
i
‑1个设备和所述N
i
个设备中,其中,所述(M
i
‑1+N
i
)组待处理样本信息与所述M
i
‑1个设备和所述N
i
个设备一一对应;使用所述M
i
‑1个设备和所述N
i
个设备中的所述第i
‑
1轮训练得到的信息处理模型对对应的一组待处理样本信息执行所述处理操作,共得到(M
i
‑1+N
i
)组预测处理结果;根据所述(M
i
‑1+N
i
)组预测处理结果和预先确定的与所述(M
i
‑1+N
i
)组待处理样本信息对应的(M
i
‑1+N
i
)组实际处理结果,确定所述第i轮训练对应的损失值;在所述第i轮训练对应的损失值不满足预设的收敛条件的情况下,调整所述第i
‑
1轮训练得到的信息处理模型中的参...
【专利技术属性】
技术研发人员:李亚宁,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。