一种动态图像分类方法技术

技术编号:21274108 阅读:33 留言:0更新日期:2019-06-06 08:18
本发明专利技术公开了一种动态图像分类方法,从图片中随机选取一张图作为输入经过LeNet模型得到Q函数;根据Q函数选取一个动作1或0得到一个奖励和下一张图片;根据奖励更新LeNet模型各层的权重从而得到新的LeNet模型。得到的下一张图作为更新后LeNet模型的输入重复上述操作直到遍历所有图片,保存模型。本发明专利技术结合LeNet和强化学习中Qlearning算法用来处理动态图像分类问题,本发明专利技术可以用来处理各种大样本数据集如ciffa10,ciffa100等。

【技术实现步骤摘要】
一种动态图像分类方法
本专利技术属于图像分类
,涉及一种动态图像分类方法,具体涉及一种基于深度学习和强化学习的动态图像分类方法。
技术介绍
随着人工智能的发展,基于深度学习的图像分类有着广泛的应用前景和重要研究价值,近年来成为了研究热点领域,无论是工业应用,还是学术研究都已取得了许多有价值的成果。强化学习是机器学习的一个重要分支,主要用来解决决策问题。强化学习可以在复杂的、不确定的环境中学习如何实现设定的目标,并且应用场景非常广,如控制机器人的电机让它执行特定任务、给商品定价或者进行库存管理、玩视频游戏或棋牌游戏等。深度学习算法如AlexNet,VggNet,ResNet等处理图像分类问题时,训练完成后参数就固定了,无法改变。而生产线上的图片是源源不断的、动态的,需要模型可以随时更新,故深度学习算法无法解决此类动态问题,而目前强化学习主要应用于处理游戏,没有适用于图像分类方向的算法。
技术实现思路
为了解决上述技术问题,本专利技术开拓性地提出了一种基于深度学习和强化学习的动态图像分类方法,结合LeNet模型的提取特征能力和强化学习算法中Qlearning的动态决策能力处理生产线上图片不断增加的问题。本专利技术所采用的技术方案是:一种动态图像分类方法,其特征在于,包括以下步骤:步骤1:获取若干图片,作为样本集;步骤2:将样本集分为若干子集;步骤3:从第一个子集中的图片中随机选取一张图作为输入经过LeNet模型逼近Q(s,a;θ)函数,其中s表示状态,a表示动作,θ表示LeNet模型的权重;步骤4:根据Q(s,a;θ)函数选取一个动作1或0,得到一个奖励和下一张图片;其中,1和0分别表示图片的2个对立的类别;所述得到一个奖励,如果分类正确,则+1分;如果分类错误,则-1分;得分越高分类准确率越高;步骤5:根据奖励更新LeNet模型各层的权重从而得到新的LeNet模型;步骤6:得到的下一张图作为更新后LeNet模型的输入重复上述操作直到遍历第一个子集中的所有图片,保存模型;步骤7:将第后一个子集中的图片添加到前面的子集中,回转执行步骤3;步骤8:对比每次的准确率;如果准确率下降,如果准确率下降,所有的训练要重新开始,从第一个子集中的图片开始,回转执行步骤3;如果准确率增加或不变,则保存模型。相对现有技术,本专利技术的有益效果是:结合了LeNet模型(已有的深度学习模型)和Qlearning(已有的强化学习算法)用于处理动态图片分类问题,深度学习算法单独使用不能够处理动态图片分类问题,而强化学习目前几乎没有用于图像分类领域的算法,本技术将两者结合并用于处理动态图片分类问题。附图说明图1为本专利技术实施例的流程图;图2为本专利技术实施例中LeNet模型图;图3为本专利技术实施例的LeNet与Qlearning算法原理图。具体实施方式为了便于本领域普通技术人员理解和实施本专利技术,下面结合附图及实施例对本专利技术作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本专利技术,并不用于限定本专利技术。请见图1和图3,本专利技术提供的一种动态图像分类方法,包括以下步骤:步骤1:获取若干图片,作为样本集;本实施例以龙虾样本为例,选取本地图片20000张;步骤2:将样本集分为若干子集;本实施例将将样本集分为4份,每份5000张,为模拟动态过程做准备。步骤3:从第一个子集中的图片中随机选取一张图作为输入经过LeNet模型逼近Q(s,a;θ)函数,其中s表示状态,a表示动作,θ表示LeNet模型的权重;请见图2,本实施例的LeNet模型,包括3层5*5的卷积层、两层池化层和两层全连接层。步骤4:根据Q(s,a;θ)函数选取一个动作1或0,得到一个奖励和下一张图片;其中,1和0分别表示图片的2个对立的类别(本实施例1和0分别表示好的龙虾图片和坏的龙虾图片);所述得到一个奖励,如果分类正确,则+1分;如果分类错误,则-1分;因为每一张图片都做了分类,将样本分为两类,以龙虾为例,将好的龙虾分为一类用1作为标签,龙虾用0作为标签,分类正确+1分,分类错误-1分,最终是通过得到的分数来判断分类的准确性,得分越高分类准确率越高,分类效果越好。步骤5:根据奖励更新LeNet模型各层的权重从而得到新的LeNet模型;步骤6:得到的下一张图作为更新后LeNet模型的输入重复上述操作直到遍历第一个子集中的所有图片,保存模型;步骤7:将第后一个子集中的图片添加到前面的子集中,回转执行步骤3;本实施例训练时依次增加图片,第一次5000张,第二次10000张,第三次15000,第四次20000张,通过这种方法模拟动态过程。步骤8:对比每次的准确率;如果准确率下降,如果准确率下降,调LeNet模型比如增加1*1的卷积模块等方法来加强算法,所有的训练要重新开始,从第一个子集中的图片开始,回转执行步骤3;如果准确率增加或不变,则保存模型。本专利技术主要应用于动态图像分类,单独使用目前分类效果较好的深度学习算法无法处理在生产线上图片不断增加这类动态问题,而目前强化学习主要应用于处理游戏。故本专利技术结合LeNet和强化学习中Qlearning算法用来处理动态图像分类问题。本专利技术也可以用来处理各种大样本数据集如ciffa10,ciffa100等。应当理解的是,本说明书未详细阐述的部分均属于现有技术。应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本专利技术专利保护范围的限制,本领域的普通技术人员在本专利技术的启示下,在不脱离本专利技术权利要求所保护的范围情况下,还可以做出替换或变形,均落入本专利技术的保护范围之内,本专利技术的请求保护范围应以所附权利要求为准。本文档来自技高网...

【技术保护点】
1.一种动态图像分类方法,其特征在于,包括以下步骤:步骤1:获取若干图片,作为样本集;步骤2:将样本集分为若干子集;步骤3:从第一个子集中的图片中随机选取一张图作为输入经过LeNet模型逼近Q(s,a;θ)函数,其中s表示状态,a表示动作,θ表示LeNet模型的权重;步骤4:根据Q(s,a;θ)函数选取一个动作1或0,得到一个奖励和下一张图片;其中,1和0分别表示图片的2个对立的类别;所述得到一个奖励,如果分类正确,则+1分;如果分类错误,则‑1分;得分越高分类准确率越高;步骤5:根据奖励更新LeNet模型各层的权重从而得到新的LeNet模型;步骤6:得到的下一张图作为更新后LeNet模型的输入重复上述操作直到遍历第一个子集中的所有图片,保存模型;步骤7:将后一个子集中的图片添加到前面的子集中,回转执行步骤3;步骤8:对比每次的准确率;如果准确率下降,如果准确率下降,微调LeNet模型,所有的训练要重新开始,从第一个子集中的图片开始,回转执行步骤3;如果准确率增加或不变,则保存模型。

【技术特征摘要】
1.一种动态图像分类方法,其特征在于,包括以下步骤:步骤1:获取若干图片,作为样本集;步骤2:将样本集分为若干子集;步骤3:从第一个子集中的图片中随机选取一张图作为输入经过LeNet模型逼近Q(s,a;θ)函数,其中s表示状态,a表示动作,θ表示LeNet模型的权重;步骤4:根据Q(s,a;θ)函数选取一个动作1或0,得到一个奖励和下一张图片;其中,1和0分别表示图片的2个对立的类别;所述得到一个奖励,如果分类正确,则+1分;如果分类错误,则-1分;得分越高分类准确率越高;步骤5:根据奖励更新LeNet模型各层的权重从而得到新的LeNet模型;步骤6:得到的下一...

【专利技术属性】
技术研发人员:舒军杨露吴柯蒋明威李振亚邓明舟舒心怡潘健王淑青
申请(专利权)人:湖北工业大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1