一种模型更新方法、装置及物联网设备制造方法及图纸

技术编号:36649196 阅读:13 留言:0更新日期:2023-02-18 13:10
本发明专利技术公开了一种模型更新方法、装置及物联网设备,涉及计算机处理技术领域,以解决现有物联网设备中模型的泛化能力较差的问题。该物联网设备中配置有目标模型,所述目标模型是基于标定有类别标签的第一样本数据集进行训练得到的,该方法包括:获取目标样本数据;对所述目标样本数据进行类别识别;在识别所述目标样本数据为未知类别的情况下,基于所述目标样本数据与所述第一样本数据集中的样本数据的相关关系,确定所述目标样本数据的目标类别标签;利用所述目标样本数据和所述目标类别标签,对所述目标模型进行更新。本发明专利技术实施例可提高物联网设备中模型的泛化能力。提高物联网设备中模型的泛化能力。提高物联网设备中模型的泛化能力。

【技术实现步骤摘要】
一种模型更新方法、装置及物联网设备


[0001]本专利技术涉及计算机处理
,尤其涉及一种模型更新方法、装置及物联网设备。

技术介绍

[0002]随着移动互联网技术的发展,物联网设备得到普及应用,而物联网设备中通常会嵌入各种模型,如图像识别模型、语音识别模型、目标检测模型等,用于处理各类目标事务。目前,物联网设备所处的环境具有以下特点:实际环境中的数据分布与训练数据集中的数据分布很大概率不一致;环境中随时会有新事物、新事件等出现,导致样本类别发生变化,且这种变化具有不可预见性;物联网设备可能存在更换用户、更换部署位置等情况,造成原有模型不再适用。
[0003]而现有的机器学习方法只有在封闭、静态的环境中才有可能达到其训练时的准确率,其适用性对环境有非常严格的要求,例如需要实际环境中的数据分布与训练数据集中的数据分布基本一致,需要实际环境中的样本类别必须与训练数据集中情况一致等,这些问题都限制了现有机器学习在个性化物联网环境中的可用性。因此现有机器学习方法并不适用于随机、开放、动态的物联网环境,可见,现有物联网设备中模型的泛化能力较差。

技术实现思路

[0004]本专利技术实施例提供一种模型更新方法、装置及物联网设备,以解决现有物联网设备中模型的泛化能力较差的问题。
[0005]第一方面,本专利技术实施例提供了一种模型更新方法,应用于物联网设备,其特征在于,所述物联网设备中配置有目标模型,所述目标模型是基于标定有类别标签的第一样本数据集进行训练得到的,所述方法包括:
[0006]获取目标样本数据;
[0007]对所述目标样本数据进行类别识别;
[0008]在识别所述目标样本数据为未知类别的情况下,基于所述目标样本数据与所述第一样本数据集中的样本数据的相关关系,确定所述目标样本数据的目标类别标签;
[0009]利用所述目标样本数据和所述目标类别标签,对所述目标模型进行更新。
[0010]可选的,所述在识别所述目标样本数据为未知类别的情况下,基于所述目标样本数据与所述第一样本数据集中的样本数据的相关关系,确定所述目标样本数据的目标类别标签,包括:
[0011]在识别所述目标样本数据为未知类别的情况下,将所述目标样本数据存储至预设数据库;
[0012]在所述预设数据库中的目标样本数据数量达到预设数量的情况下,对所述预设数据库中的目标样本数据进行聚类处理,得到N个未知类别簇,N为正整数;
[0013]确定所述N个未知类别簇中每个未知类别簇的中心点样本;
[0014]基于每个未知类别簇的中心点样本与所述第一样本数据集中各已知类别的中心点样本的相关关系,确定每个未知类别簇的目标类别标签;
[0015]所述利用所述目标样本数据和所述目标类别标签,对所述目标模型进行更新,包括:
[0016]利用所述预设数据库中的目标样本数据和所述每个未知类别簇的目标类别标签,对所述目标模型进行更新。
[0017]可选的,所述基于每个未知类别簇的中心点样本与所述第一样本数据集中各已知类别的中心点样本的相关关系,确定每个未知类别簇的目标类别标签,包括:
[0018]基于每个未知类别簇的中心点样本与所述第一样本数据集中各已知类别的中心点样本的相关关系和预先建立的类别关系图谱,确定每个未知类别簇的备选类别标签;
[0019]确定每个未知类别簇中的代表样本;
[0020]分别从每个未知类别簇的备选类别标签中选择一个类别标签作为该未知类别簇的代表样本标签;
[0021]基于每个未知类别簇的代表样本标签,利用标签传播算法确定每个未知类别簇中每个目标样本数据的目标类别标签。
[0022]可选的,所述利用所述预设数据库中的目标样本数据和所述每个未知类别簇的目标类别标签,对所述目标模型进行更新,包括:
[0023]分别从所述第一样本数据集和所述预设数据库中选取数量均衡的样本数据,得到训练样本数据集;
[0024]利用所述训练样本数据集对所述目标模型进行更新训练,得到更新后的目标模型。
[0025]可选的,所述目标模型包括特征抽取网络和分类器;
[0026]所述利用所述训练样本数据集对所述目标模型进行更新训练,得到更新后的目标模型,包括:
[0027]将所述训练样本数据集按类别标签的不同随机划分成M类支撑样本和M类询问样本,其中,M为大于1的整数;
[0028]将所述M类支撑样本和所述M类询问样本分别输入所述目标模型中的特征抽取网络,得到每类支撑样本的特征值和每类询问样本的特征值;
[0029]将每类支撑样本的特征均值确定为该类类别原型;
[0030]分别计算每类询问样本的特征值与每类类别原型的距离值;
[0031]基于所述每类询问样本的特征值与每类类别原型的距离值,确定损失函数值;
[0032]以最小化所述损失函数值为目标,训练所述特征抽取网络和所述分类器的模型参数,直至得到更新后的目标模型。
[0033]可选的,所述损失函数值等于第一距离和值除以第二距离和值,其中,所述第一距离和值等于每类询问样本的特征值与对应类类别原型的距离值之和,第二距离和值等于每类询问样本的特征值与除该类类别原型之外的其他类类别原型的距离值之和。
[0034]可选的,所述利用所述预设数据库中的目标样本数据和所述每个未知类别簇的目标类别标签,对所述目标模型进行更新之后,所述方法还包括:
[0035]将所述预设数据库中的目标样本数据归至所述第一样本数据集,并清空所述预设
数据库。
[0036]第二方面,本专利技术实施例还提供一种模型更新装置,应用于物联网设备,所述物联网设备中配置有目标模型,所述目标模型是基于标定有类别标签的第一样本数据集进行训练得到的,所述模型更新装置包括:
[0037]获取模块,用于获取目标样本数据;
[0038]识别模块,用于对所述目标样本数据进行类别识别;
[0039]确定模块,用于在识别所述目标样本数据为未知类别的情况下,基于所述目标样本数据与所述第一样本数据集中的样本数据的相关关系,确定所述目标样本数据的目标类别标签;
[0040]更新模块,用于利用所述目标样本数据和所述目标类别标签,对所述目标模型进行更新。
[0041]可选的,所述确定模块包括:
[0042]存储子模块,用于在识别所述目标样本数据为未知类别的情况下,将所述目标样本数据存储至预设数据库;
[0043]聚类子模块,用于在所述预设数据库中的目标样本数据数量达到预设数量的情况下,对所述预设数据库中的目标样本数据进行聚类处理,得到N个未知类别簇,N为正整数;
[0044]第一确定子模块,用于确定所述N个未知类别簇中每个未知类别簇的中心点样本;
[0045]第二确定子模块,用于基于每个未知类别簇的中心点样本与所述第一样本数据集中各已知类别的中心点样本的相关关系,确定每个未知类别簇的目标类别标签;
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型更新方法,应用于物联网设备,其特征在于,所述物联网设备中配置有目标模型,所述目标模型是基于标定有类别标签的第一样本数据集进行训练得到的,所述方法包括:获取目标样本数据;对所述目标样本数据进行类别识别;在识别所述目标样本数据为未知类别的情况下,基于所述目标样本数据与所述第一样本数据集中的样本数据的相关关系,确定所述目标样本数据的目标类别标签;利用所述目标样本数据和所述目标类别标签,对所述目标模型进行更新。2.根据权利要求1所述的方法,其特征在于,所述在识别所述目标样本数据为未知类别的情况下,基于所述目标样本数据与所述第一样本数据集中的样本数据的相关关系,确定所述目标样本数据的目标类别标签,包括:在识别所述目标样本数据为未知类别的情况下,将所述目标样本数据存储至预设数据库;在所述预设数据库中的目标样本数据数量达到预设数量的情况下,对所述预设数据库中的目标样本数据进行聚类处理,得到N个未知类别簇,N为正整数;确定所述N个未知类别簇中每个未知类别簇的中心点样本;基于每个未知类别簇的中心点样本与所述第一样本数据集中各已知类别的中心点样本的相关关系,确定每个未知类别簇的目标类别标签;所述利用所述目标样本数据和所述目标类别标签,对所述目标模型进行更新,包括:利用所述预设数据库中的目标样本数据和所述每个未知类别簇的目标类别标签,对所述目标模型进行更新。3.根据权利要求2所述的方法,其特征在于,所述基于每个未知类别簇的中心点样本与所述第一样本数据集中各已知类别的中心点样本的相关关系,确定每个未知类别簇的目标类别标签,包括:基于每个未知类别簇的中心点样本与所述第一样本数据集中各已知类别的中心点样本的相关关系和预先建立的类别关系图谱,确定每个未知类别簇的备选类别标签;确定每个未知类别簇中的代表样本;分别从每个未知类别簇的备选类别标签中选择一个类别标签作为该未知类别簇的代表样本标签;基于每个未知类别簇的代表样本标签,利用标签传播算法确定每个未知类别簇中每个目标样本数据的目标类别标签。4.根据权利要求2所述的方法,其特征在于,所述利用所述预设数据库中的目标样本数据和所述每个未知类别簇的目标类别标签,对所述目标模型进行更新,包括:分别从所述第一样本数据集和所述预设数据库中选取数量均衡的样本数据,得到训练样本数据集;利用所述训练样本数据集对所述目标模型进行更新训练,得到更新后...

【专利技术属性】
技术研发人员:孔德群鲍媛媛
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1