对象分类模型的训练方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:37547464 阅读:17 留言:0更新日期:2023-05-12 16:22
本申请公开了一种对象分类模型的训练方法、装置、计算机设备和存储介质,该方法包括:获取源样本域及目标样本域;源样本域中第一样本数据与目标样本域中第二样本数据具有训练对象不同模态的对象特征;调用对象分类模型在第一样本数据和训练对象对应的对象总结特征之间进行特征测算得到特征总结偏差;调用对象分类模型对第二样本数据与训练对象对应的对象总结特征进行特征匹配得到第二样本数据所属对象的预测对象类型;根据第二样本数据所属对象的预测对象类型和第二样本数据所携带的对象类型标签生成类型预测偏差;根据特征总结偏差和类型预测偏差更新对象分类模型的模型参数。采用本申请,可提高所训练得到的对象分类模型的分类准确性。类模型的分类准确性。类模型的分类准确性。

【技术实现步骤摘要】
对象分类模型的训练方法、装置、计算机设备和存储介质


[0001]本申请涉及计算机
,尤其涉及一种对象分类模型的训练方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着计算机网络的不断发展,机器学习在很多场景都得到了应用,其中,机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
[0003]现有应用中,当通过小样本(样本数量少)进行模型训练时,可以将不同模态的大样本(样本数量多)的特征迁移到小样本一起进行训练,如可以对小样本中的样本与大样本中的样本进行两两匹配,继而通过匹配的结果以及标签(如样本的类型标签)的差异性来实现特征学习。但是,采用此种方式进行模型迁移训练时,由于小样本所包含的样本数量很少,不同样本之间的特征差异性巨大,因此,通过对小样本的样本和大样本的样本进行两两匹配这种点到点的方式实现模型迁移训练,所训练得到的模型并不准确。

技术实现思路

[0004]本申请提供了一种对象分类模型的训练方法、装置、计算机设备和存储介质,可提高所训练得到的对象分类模型的分类准确性。
[0005]本申请一方面提供了一种对象分类模型的训练方法,该方法包括:
[0006]获取源样本域中的第一样本数据及目标样本域中的第二样本数据;源样本域和目标样本域均用于对N种训练对象进行训练;源样本域中的第一样本数据与目标样本域中的第二样本数据各自具有N种训练对象不同模态的对象特征;源样本域中的第一样本数据与目标样本域中的第二样本数据均携带所属训练对象的对象类型标签;目标样本域中的第二样本数据的数量少于源样本域中的第一样本数据的数量;
[0007]调用对象分类模型在源样本域中的第一样本数据和N种训练对象分别对应的对象总结特征之间进行特征测算,得到针对对象总结特征的特征总结偏差;对象分类模型的模型参数包含N种训练对象分别对应的对象总结特征;
[0008]调用对象分类模型对目标样本域中的第二样本数据与每种训练对象分别对应的对象总结特征进行特征匹配,得到目标样本域中第二样本数据所属对象的预测对象类型;
[0009]根据目标样本域中第二样本数据所属对象的预测对象类型和目标样本域中第二样本数据所携带的对象类型标签生成类型预测偏差;
[0010]根据特征总结偏差和类型预测偏差更新对象分类模型的模型参数,得到训练好的对象分类模型。
[0011]本申请一方面提供了一种对象分类模型的训练装置,该装置包括:
[0012]样本获取模块,用于获取源样本域中的第一样本数据及目标样本域中的第二样本
数据;源样本域和目标样本域均用于对N种训练对象进行训练;源样本域中的第一样本数据与目标样本域中的第二样本数据各自具有N种训练对象不同模态的对象特征;源样本域中的第一样本数据与目标样本域中的第二样本数据均携带所属训练对象的对象类型标签;目标样本域中的第二样本数据的数量少于源样本域中的第一样本数据的数量;
[0013]特征测算模块,用于调用对象分类模型在源样本域中的第一样本数据和N种训练对象分别对应的对象总结特征之间进行特征测算,得到针对对象总结特征的特征总结偏差;对象分类模型的模型参数包含N种训练对象分别对应的对象总结特征;
[0014]特征匹配模块,用于调用对象分类模型对目标样本域中的第二样本数据与每种训练对象分别对应的对象总结特征进行特征匹配,得到目标样本域中第二样本数据所属对象的预测对象类型;
[0015]偏差生成模块,用于根据目标样本域中第二样本数据所属对象的预测对象类型和目标样本域中第二样本数据所携带的对象类型标签,生成类型预测偏差;
[0016]训练模块,用于根据特征总结偏差和类型预测偏差更新对象分类模型的模型参数,得到训练好的对象分类模型。
[0017]可选的,N种训练对象中的任一种训练对象表示为第k种训练对象,k为小于或等于N的正整数;源样本域中包含第k种训练对象的M个第一样本数据,M为小于N的正整数;
[0018]上述装置获取对象分类模型中每种训练对象分别对应的对象总结特征的流程,包括:
[0019]从M个第一样本数据中选取P个第一样本数据;P为小于M的正整数;
[0020]根据M个第一样本数据和P个第一样本数据生成第k种训练对象的P个对象总结特征。
[0021]可选的,上述装置根据P个第一样本数据生成第k种训练对象对应的P个对象总结特征的方式,包括:
[0022]调用对象分类模型对M个第一样本数据进行特征提取,生成M个第一样本数据分别对应的样本特征;
[0023]生成P个第一样本数据分别所属的第一初始样本集合;一个第一初始样本集合包含P个第一样本数据中的一个第一样本数据;
[0024]将M个第一样本数据中除P个第一样本数据之外的第一样本数据确定为待定样本数据;
[0025]根据多个待定样本数据的样本特征分别与P个第一样本数据的样本特征之间的特征距离,将多个待定样本数据归类到P个第一初始样本集合中,得到P个第一归类样本集合;
[0026]根据P个第一归类样本集合生成P个对象总结特征。
[0027]可选的,上述装置根据P个第一归类样本集合生成P个对象总结特征的方式,包括:
[0028]分别对每个第一归类样本集合中所包含的第一样本数据的样本特征进行特征平均处理,得到每个第一归类样本集合分别对应的第一平均样本特征;
[0029]生成P个第一平均样本特征分别对应的第二初始样本集合,该第二初始样本集合为空;
[0030]根据M个第一样本数据的样本特征分别与P个第一平均样本特征之间的特征距离,将M个第一样本数据归类到P个第二初始样本集合中,得到P个第二归类样本集合;
[0031]根据P个第二归类样本集合生成P个对象总结特征。
[0032]可选的,上述装置根据P个第二归类样本集合生成P个对象总结特征的流程,包括:
[0033]分别对每个第二归类样本集合中所包含的第一样本数据的样本特征进行特征平均处理,得到每个第二归类样本集合分别对应的第二平均样本特征;
[0034]将P个第二平均样本特征确定为P个对象总结特征。
[0035]可选的,N种训练对象中的任一种训练对象表示为第k种训练对象,k为小于或等于N的正整数,一种训练对象对应的对象总结特征的数量为多个;
[0036]训练模块根据特征总结偏差和类型预测偏差更新对象分类模型的模型参数,得到训练好的对象分类模型的方式,包括:
[0037]调用对象分类模型获取第k种训练对象对应的多个对象总结特征之间的特征差异;特征差异用于使第k种训练对象对应的多个对象总结特征之间的差异达到最大化;
[0038]根据特征差异、特征总结偏差和类型预测偏差更新对象分类模型的模型参数,得本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对象分类模型的训练方法,其特征在于,所述方法包括:获取源样本域中的第一样本数据及目标样本域中的第二样本数据;所述源样本域和所述目标样本域均用于对N种训练对象进行训练;所述源样本域中的第一样本数据与所述目标样本域中的第二样本数据各自具有所述N种训练对象不同模态的对象特征;所述源样本域中的第一样本数据与所述目标样本域中的第二样本数据均携带所属训练对象的对象类型标签;所述目标样本域中的第二样本数据的数量少于所述源样本域中的第一样本数据的数量;调用对象分类模型在所述源样本域中的第一样本数据和所述N种训练对象分别对应的对象总结特征之间进行特征测算,得到针对对象总结特征的特征总结偏差;所述对象分类模型的模型参数包含所述N种训练对象分别对应的对象总结特征;调用所述对象分类模型对所述目标样本域中的第二样本数据与每种训练对象分别对应的对象总结特征进行特征匹配,得到所述目标样本域中第二样本数据所属对象的预测对象类型;根据所述目标样本域中第二样本数据所属对象的预测对象类型和所述目标样本域中第二样本数据所携带的对象类型标签生成类型预测偏差;根据所述特征总结偏差和所述类型预测偏差更新所述对象分类模型的模型参数,得到训练好的对象分类模型。2.根据权利要求1所述的方法,其特征在于,所述N种训练对象中的任一种训练对象表示为第k种训练对象,k为小于或等于N的正整数;所述源样本域中包含所述第k种训练对象的M个第一样本数据,M为小于N的正整数;获取所述对象分类模型中所述每种训练对象分别对应的对象总结特征的流程,包括:从所述M个第一样本数据中选取P个第一样本数据;P为小于M的正整数;根据所述M个第一样本数据和所述P个第一样本数据生成所述第k种训练对象的P个对象总结特征。3.根据权利要求2所述的方法,其特征在于,所述根据所述P个第一样本数据生成所述第k种训练对象对应的P个对象总结特征,包括:调用所述对象分类模型对所述M个第一样本数据进行特征提取,生成所述M个第一样本数据分别对应的样本特征;生成所述P个第一样本数据分别所属的第一初始样本集合;一个第一初始样本集合包含所述P个第一样本数据中的一个第一样本数据;将所述M个第一样本数据中除所述P个第一样本数据之外的第一样本数据确定为待定样本数据;根据多个待定样本数据的样本特征分别与所述P个第一样本数据的样本特征之间的特征距离,将所述多个待定样本数据归类到P个第一初始样本集合中,得到P个第一归类样本集合;根据所述P个第一归类样本集合生成所述P个对象总结特征。4.根据权利要求3所述的方法,其特征在于,所述根据所述P个第一归类样本集合生成所述P个对象总结特征,包括:分别对每个第一归类样本集合中所包含的第一样本数据的样本特征进行特征平均处
理,得到所述每个第一归类样本集合分别对应的第一平均样本特征;生成P个第一平均样本特征分别对应的第二初始样本集合,该第二初始样本集合为空;根据所述M个第一样本数据的样本特征分别与所述P个第一平均样本特征之间的特征距离,将所述M个第一样本数据归类到P个第二初始样本集合中,得到P个第二归类样本集合;根据所述P个第二归类样本集合生成所述P个对象总结特征。5.根据权利要求4所述的方法,其特征在于,所述根据所述P个第二归类样本集合生成所述P个对象总结特征,包括:分别对每个第二归类样本集合中所包含的第一样本数据的样本特征进行特征平均处理,得到所述每个第二归类样本集合分别对应的第二平均样本特征;将P个第二平均样本特征确定为所述P个对象总结特征。6.根据权利要求1所述的方法,其特征在于,所述N种训练对象中的任一种训练对象表示为第k种训练对象,k为小于或等于N的正整数,一种训练对象对应的对象总结特征的数量为多个;所述根据所述特征总结偏差和所述类型预测偏差更新所述对象分类模型的模型参数,得到训练好的对象分类模型,包括:调用所述对象分类模型获取所述第k种训练对象对应的多个对象总结特征之间的特征差异;所述特征差异用于使所述第k种训练对象对应的多个对象总结特征之间的差异达到最大化;根据所述特征差异、所述特征总结偏差和所述类型预测偏差更新所述对象分类模型的模型参数,得到训练好的对象分类模型。7.根据权利要求1所述的方法,其特征在于,所述目标样本域中的任一个第二样本数据表示为第j个第二样本数据,j为小于或等于所述目标样本域中第二样本数据的总数量的正整数;一种训练对象对应的对象总结特征的数量为多个;所述调用所述对象分类模型对所述目标样本域中的第二样本数据与每种训练对象分别对应的对象总结特征进行特征匹配,得到针对所述目标样本域中第二样本数据的预测对象类型,包括:调用所述对象分类模型对所述第j个第二样本数据进行特征提取,生成所述第j个第二样本数据的样本特征;对所述第j个第二样本数据的样本特征与所述每种训练对象分别对应的对象总结特征进行特征匹配;将所匹配的与所述第j个第二样本数据的样本特征之间的特征距离最小...

【专利技术属性】
技术研发人员:顾运
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1