一种训练模型的方法及装置制造方法及图纸

技术编号:23766540 阅读:31 留言:0更新日期:2020-04-11 20:08
本说明书公开了一种训练模型的方法及装置,通过在样本集中选择若干样本图像构成样本子集,针对预设的各标签,确定具有该标签的样本图像在样本子集中的占比,根据具有该标签的样本图像在样本子集中的占比,确定交叉熵,由于不同的样本子集中,具有该标签的样本图像在样本子集中的占比可能不同,交叉熵也可能不同,解决了现有技术中标签权重固定不变的问题,另外,在根据交叉熵对待训练图像分类模型进行训练时,具有小概率标签的样本图像在样本子集中的占比不一定较小,因此上述方法尤其可以解决小概率标签的过拟合学习问题。

A method and device of training model

【技术实现步骤摘要】
一种训练模型的方法及装置
本申请涉及图像处理领域,尤其涉及一种训练模型的方法及装置。
技术介绍
图像中包含着丰富的信息,为了便于图像数据的查询与处理,一般会对图像设置标签,使图像具有直观的文本描述,例如,一份烛光晚餐的图像,可具有多个标签:食物、玫瑰、餐具等。确定标签常用的方法,是将待确定标签的图像输入训练后的分类模型,得到该图像具有各标签的概率,根据得到的概率,确定图像标签。训练上述分类模型时所用的样本集,来源于现实生活,大多数的样本图像中包含蓝天、白云、房屋、树木等标签,少数样本图像中包括棒球、雪橇等标签,针对各标签,根据具有该标签的图像在样本集中出现的概率,对该标签设置权重,根据各标签对应的权重,对上述分类模型训练。由于训练上述分类模型时,不同标签对应的样本图像在数量上不均衡,并且各标签的权重固定不变,这就导致样本数量少的小概率标签会出现过拟合学习,在确定未知图像的标签时,尤其当该未知图像中可能存在棒球等小概率标签时,利用按照上述方法训练完成的分类模型,得到的针对未知图像的标签中,可能会出现错误的标签。专利本文档来自技高网...

【技术保护点】
1.一种训练模型的方法,其特征在于,所述方法包括:/n从包含多个图像的样本集中选择若干样本图像,确定由选择的所述若干样本图像构成的样本子集;/n针对预设的各标签,确定具有该标签的样本图像在所述样本子集中的占比;/n根据具有该标签的样本图像在所述样本子集中的占比,确定待训练图像分类模型的交叉熵;/n根据针对各标签分别确定的交叉熵,采用所述样本子集中的样本图像对所述待训练图像分类模型进行训练。/n

【技术特征摘要】
1.一种训练模型的方法,其特征在于,所述方法包括:
从包含多个图像的样本集中选择若干样本图像,确定由选择的所述若干样本图像构成的样本子集;
针对预设的各标签,确定具有该标签的样本图像在所述样本子集中的占比;
根据具有该标签的样本图像在所述样本子集中的占比,确定待训练图像分类模型的交叉熵;
根据针对各标签分别确定的交叉熵,采用所述样本子集中的样本图像对所述待训练图像分类模型进行训练。


2.如权利要求1所述的方法,其特征在于,根据具有该标签的样本图像在所述样本子集中的占比,确定待训练图像分类模型的交叉熵,具体包括:
根据具有该标签的样本图像在所述样本子集中的占比,确定该标签对应的交叉熵权重;
针对具有该标签的每个样本图像,确定所述待训练图像分类模型输出的该样本图像具有该标签的预估概率;
根据该标签对应的交叉熵权重、该样本图像具有该标签的真实概率以及所述预估概率,确定所述待训练图像分类模型的交叉熵。


3.如权利要求1所述的方法,其特征在于,所述方法还包括:
根据具有该标签的样本图像在所述样本子集中的占比、以及不具有该标签的样本图像在所述样本子集中的占比,确定具有该标签的样本图像在所述样本子集中的均衡度;
根据所述均衡度,确定所述待训练图像分类模型的均衡参数;
根据针对各标签分别确定的交叉熵,采用所述样本子集中的样本图像对所述待训练图像分类模型进行训练,具体包括:
根据针对各标签分别确定的交叉熵以及均衡参数,采用所述样本子集中的样本图像对所述待训练图像分类模型进行训练。


4.如权利要求1所述的方法,其特征在于,所述方法还包括:
根据预设的分类规则,确定该标签所属的子类;
确定所述子类的父类的数量;
根据所述数量,确定所述待训练图像分类模型的子类参数;
根据针对各标签分别确定的交叉熵,采用所述样本子集中的样本图像对所述待训练图像分类模型进行训练,具体包括:
根据针对各标签分别确定的交叉熵以及子类参数,采用所述样本子集中的样本图像对所述待训练图像分类模型进行训练。


5.如权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述样本子集中具有该标签的样本图像的数量,作为第一数量;
确定上一次对所述待训练图像分类模型进行训练时所采用的样本子集中具有该标签的样本图像的数量,作为第二数量;
确定所述第一数量与...

【专利技术属性】
技术研发人员:朱理王博谢存煌
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1