一种训练样本数据的获取方法、处理方法、装置及系统制造方法及图纸

技术编号:29281244 阅读:15 留言:0更新日期:2021-07-16 23:19
本说明书公开一种训练样本数据的获取方法、处理方法、装置及系统,其中适于在边缘计算服务器上执行的数据获取方法,包括:根据当前训练集训练目标模型,基于所述当前目标模型,获得评估数据样本对当前目标模型重要性的当前重要性计算模型,通过所述当前重要性计算模型对测试集中每一数据样本计算重要性评估值,获得重要性均值L

The invention relates to a training sample data acquisition method, a processing method, a device and a system

【技术实现步骤摘要】
一种训练样本数据的获取方法、处理方法、装置及系统


[0001]本专利技术涉及通信
,具体而言,涉及一种训练样本数据的获取方法、处理方法、装置及系统。

技术介绍

[0002]随着物联网、车联网等技术的发展和大规模智能终端的部署,边缘计算在处理终端产生的大量数据发挥着越来越重要的作用,针对边缘计算中的设备部署、资源分配、性能优化的研究也越来越多。相关的研究从各种不同的方面入手优化边缘计算的通信性能或将边缘计算方法结合实际应用中。相关的边缘计算技术主要研究如何通过资源的分配提高信道利用率、最大化通信容量、降低时延,但不会考虑传输的数据本身对模型训练的重要程度。而在边缘学习中,优化的目标还应包括模型的性能,而对于学习模型的训练,不同数据的重要性是不一样的。所以通信方案的设计除了获得更高的通信容量外,还应考虑到提高传输数据的总重要性。
[0003]综上,如何提高通信中所传输数据的重要性,优化模型的性能,成为亟待解决的问题。

技术实现思路

[0004]本说明书提供一种训练样本数据的获取方法、处理方法、装置及系统,用以克服现有技术中存在的至少一个技术问题。
[0005]根据本说明书实施例的第一方面,提供一种训练样本数据的获取方法,适于在边缘计算服务器上执行,包括:根据当前训练集训练目标模型,得到当前目标模型;基于所述当前目标模型的结构,获得评估数据样本对当前目标模型的重要性的当前重要性计算模型,所述当前重要性计算模型推理获得当前目标模型对每一输入的模拟输出,并通过该模拟输出与每一输入对应的标准输出的差距来表征当前目标模型对该输入的分析能力,以此作为该输入的重要性评估值,所述重要性评估值表征当前目标模型对该数据样本的分析能力;通过所述当前重要性计算模型对测试集中的每一数据样本计算对应的重要性评估值,并计算测试集数据样本的重要性均值L
ave
;将所述当前的重要性计算模型的参数和对应的重要性均值L
ave
以广播方式发送给各边缘设备,以使得各边缘设备依据所述当前重要性计算模型和对应的重要性均值L
ave
对向边缘计算服务器发送的数据样本进行筛选;接收各边缘设备发送的接入机会参数值,依据所述接入机会参数值计算各边缘设备的接入概率,选择接入概率最大的边缘设备,向该边缘设备发送传输触发命令,各边缘设备发送的所述接入机会参数值正比于该边缘设备待传输数据的重要性评估值与该边缘设备对应的传输速率的乘积;接收被选择的边缘设备依据所述当前重要性计算模型和对应的重要性均值L
ave
进行筛选后发送的数据,将所述数据加入当前训练集,并继续根据各边缘设备的接入机会参数值选择传输数据的边缘设备;当接收到的所述数据达到预设的数目后,通过当前训练集对目标模型进行训练,得到参数更新后的目标模型。
[0006]可选地,所述基于所述当前目标模型的结构,获得预测数据样本对当前目标模型的数据重要性的当前重要性计算模型的步骤,包括:获取重要性计算模型的训练样本集,所述训练样本集包括多个重要性训练样本,每一重要性训练样本包括一个样本数据的样本输入、标准输出以及当前目标模型对该样本输入的模型输出以及该样本数据的重要性评估值,所述重要性评估值为所述模型输出与所述标准输出的差值的二范数的平方,所述样本数据为目标模型训练集中的数据样本;通过所述训练样本集对重要性计算模型进行训练,得到当前重要性计算模型,所述重要性计算模型根据输入的数据样本,输出该数据样本对于当前目标模型的重要性评估值。
[0007]可选地,在所述当接收到的所述数据达到预设的数目后,通过当前训练集对目标模型进行训练,得到参数更新后的目标模型的步骤之后,还包括:在预设的一段时延之后,基于所述当前目标模型的结构,获得评估数据样本对当前目标模型的重要性的当前重要性计算模型,通过所述当前重要性计算模型对测试集中的每一数据样本计算对应的重要性评估值,并计算测试集数据样本的重要性均值L
ave
,将所述当前重要性计算模型的参数和对应的重要性均值L
ave
以广播方式发送给各边缘设备。
[0008]根据本说明书实施例的第二方面,提供一种训练样本数据的处理方法,适于在边缘设备上执行,包括:接收边缘计算服务器发来的当前重要性计算模型的参数和对应的重要性均值L
ave
;随机选取预设数目的数据加入预设容量固定的重要数据区中,通过所述当前重要性计算模型对重要数据区中的每一数据计算对应的重要性评估值,随机选取数据计算该数据的重要性评估值,根据该数据的重要性评估值更新重要数据区中的数据;根据所述重要性均值L
ave
以及预设的阈值θ,得到重要性阈值θL
ave
;选取重要数据区中重要性评估值最大的数据作为待传输数据,计算该待传输数据压缩后的重要性评估值,得到第一评估值;将所述第一评估值与所述重要性阈值θL
ave
进行比较,若所述第一评估值大于所述重要性阈值θL
ave
,则提高该待传输数据的压缩率并计算新的压缩率下的重要性评估值,直到该待传输数据的重要性评估值不大于所述重要性阈值θL
ave
或者达到数据传输的最大压缩率,获得该待传输数据的最大压缩率和该压缩率对应的第二评估值;测量信道条件并依据获得的信道参数计算对应的信号传输速率,根据所述待传输数据的第二评估值以及所述传输速率获得接入机会参数值,将所述接入机会参数值发送给边缘计算服务器,以使边缘计算服务器根据各边缘设备的接入机会参数值选择接入概率最大的边缘设备发送传输触发命令,所述接入机会参数值正比于待传输数据的第二评估值与传输速率的乘积;若接收到边缘计算服务器发来的传输触发命令,则将所述待传输数据以该待传输数据的最大压缩率发送给边缘计算服务器。
[0009]可选地,所述随机选取预设数目的数据加入预设容量固定的重要数据区中,通过所述当前重要性计算模型对重要数据区中的每一数据计算对应的重要性评估值,随机选取数据计算该数据的重要性评估值,根据该数据的重要性评估值更新重要数据区中的数据的步骤,包括:随机选取预设数目的数据加入预设容量固定的重要数据区;通过所述当前重要性计算模型计算重要数据区中每一数据的重要性评估值,并将重要数据区中的数据按照重要性评估值排序;随机选取重要数据区以外的数据,并通过所述当前重要性计算模型获得该数据的重要性评估值;将该数据的重要性评估值与重要数据区中数据的重要性评估值进行比较,若该数据的重要性评估值刚好大于重要数据区中的一个数据的重要性评估值,则
将该数据插入重要数据区中对应数据之前。
[0010]可选地,所述选取重要数据区中数据重要性最大的数据作为待传输数据,计算该待传输数据压缩后的重要性评估值,得到第一评估值;将所述第一评估值与所述重要性阈值θL
ave
进行比较之后,还包括:若所述第一评估值不大于所述重要性阈值θL
ave
,则将所述第一评估值作为第二评估值,并将对应的压缩率作为该待传输数据的最大本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种训练样本数据的获取方法,适于在边缘计算服务器上执行,其特征在于,包括:根据当前训练集训练目标模型,得到当前目标模型;基于所述当前目标模型的结构,获得评估数据样本对当前目标模型的重要性的当前重要性计算模型,所述当前重要性计算模型推理获得当前目标模型对每一输入的模拟输出,并通过该模拟输出与每一输入对应的标准输出的差距来表征当前目标模型对该输入的分析能力,以此作为该输入的重要性评估值,所述重要性评估值表征当前目标模型对该数据样本的分析能力;通过所述当前重要性计算模型对测试集中的每一数据样本计算对应的重要性评估值,并计算测试集数据样本的重要性均值L
ave
;将所述当前重要性计算模型的参数和对应的重要性均值L
ave
以广播方式发送给各边缘设备,以使得各边缘设备依据所述当前重要性计算模型和对应的重要性均值L
ave
对向边缘计算服务器发送的数据样本进行筛选;接收各边缘设备发送的接入机会参数值,依据所述接入机会参数值计算各边缘设备的接入概率,选择接入概率最大的边缘设备,向该边缘设备发送传输触发命令,各边缘设备发送的所述接入机会参数值正比于该边缘设备待传输数据的重要性评估值与该边缘设备对应的传输速率的乘积;接收被选择的边缘设备依据所述当前重要性计算模型和对应的重要性均值L
ave
进行筛选后发送的数据,将所述数据加入当前训练集,并继续根据各边缘设备的接入机会参数值选择传输数据的边缘设备;当接收到的所述数据达到预设的数目后,通过当前训练集对目标模型进行训练,得到参数更新后的目标模型。2.根据权利要求1所述的方法,其特征在于,所述基于所述当前目标模型的结构,获得预测数据样本对当前目标模型的数据重要性的当前重要性计算模型的步骤,包括:获取重要性计算模型的训练样本集,所述训练样本集包括多个重要性训练样本,每一重要性训练样本包括一个样本数据的样本输入、标准输出以及当前目标模型对该样本输入的模型输出以及该样本数据的重要性评估值,所述重要性评估值为所述模型输出与所述标准输出的差值的二范数的平方,所述样本数据为目标模型训练集中的数据样本;通过所述训练样本集对重要性计算模型进行训练,得到当前重要性计算模型,所述重要性计算模型根据输入的数据样本,输出该数据样本对于当前目标模型的重要性评估值。3.根据权利要求1所述的方法,其特征在于,在所述当接收到的所述数据达到预设的数目后,通过当前训练集对目标模型进行训练,得到参数更新后的目标模型的步骤之后,还包括:在预设的一段时延之后,基于所述当前目标模型的结构,获得评估数据样本对当前目标模型的重要性的当前重要性计算模型,通过所述当前重要性计算模型对测试集中的每一数据样本计算对应的重要性评估值,并计算测试集数据样本的重要性均值L
ave
,将所述当前重要性计算模型的参数和对应的重要性均值L
ave
以广播方式发送给各边缘设备。4.一种训练样本数据的处理方法,适于在边缘设备上执行,其特征在于,包括:接收边缘计算服务器发来的当前重要性计算模型的参数和对应的重要性均值L
ave
;随机选取预设数目的数据加入预设容量固定的重要数据区中,通过所述当前重要性计算模型对重要数据区中的每一数据计算对应的重要性评估值,随机选取数据计算该数据的
重要性评估值,根据该数据的重要性评估值更新重要数据区中的数据;根据所述重要性均值L
ave
以及预设的阈值θ,得到重要性阈值θL
ave
;选取重要数据区中重要性评估值最大的数据作为待传输数据,计算该待传输数据压缩后的重要性评估值,得到第一评估值;将所述第一评估值与所述重要性阈值θL
ave
进行比较,若所述第一评估值大于所述重要性阈值θL
ave
,则提高该待传输数据的压缩率并计算新的压缩率下的重要性评估值,直到该待传输数据的重要性评估值不大于所述重要性阈值θL
ave
或者达到数据传输的最大压缩率,获得该待传输数据的最大压缩率和该压缩率对应的第二评估值;测量信道条件并依据获得的信道参数计算对应的信号传输速率,根据所述待传输数据的第二评估值以及所述传输速率获得接入机会参数值,将所述接入机会参数值发送给边缘计算服务器,以使边缘计算服务器根据各边缘设备的接入机会参数值选择接入概率最大的边缘设备发送传输触发命令,所述接入机会参数值正比于待传输数据的第二评估值与传输速率的乘积;若接收到边缘计算服务器发来的传输触发命令,则将所述待传输数据以该待传输数据的最大压缩率发送给边缘计算服务器。5.根据权利要求4所述的方法,其特征在于,所述随机选取预设数目的数据加入预设容量固定的重要数据区中,通过所述当前重要性计算模型对重要数据区中的每一数据计算对应的重要性评估值,随机选取数据计算该数据的重要性评估值,根据该数据的重要性评估值更新重要数据区中的数据的步骤,包括:随机选取预设数目的数据加入预设容量固定的重要数据区;通过所述当前重要性计算模型计算重要数据区中每一数据的重要性评估值,并将重要数据区中的数据按照重要性评估值排序;随机选取重要数据区以外的数据,并通过所述当前重要性计算模型获得该数据的重要性评估值;将该数据的重要性评估值与重要数...

【专利技术属性】
技术研发人员:张剑钟绍宸孙学文王奎
申请(专利权)人:北京超星未来科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1