一种动态图像分类方法技术

技术编号：21274108 阅读：33 留言：0更新日期：2019-06-06 08:18

本发明专利技术公开了一种动态图像分类方法，从图片中随机选取一张图作为输入经过LeNet模型得到Q函数；根据Q函数选取一个动作1或0得到一个奖励和下一张图片；根据奖励更新LeNet模型各层的权重从而得到新的LeNet模型。得到的下一张图作为更新后LeNet模型的输入重复上述操作直到遍历所有图片，保存模型。本发明专利技术结合LeNet和强化学习中Qlearning算法用来处理动态图像分类问题，本发明专利技术可以用来处理各种大样本数据集如ciffa10，ciffa100等。

全部详细技术资料下载

【技术实现步骤摘要】
一种动态图像分类方法
本专利技术属于图像分类
，涉及一种动态图像分类方法，具体涉及一种基于深度学习和强化学习的动态图像分类方法。
技术介绍
随着人工智能的发展，基于深度学习的图像分类有着广泛的应用前景和重要研究价值，近年来成为了研究热点领域，无论是工业应用，还是学术研究都已取得了许多有价值的成果。强化学习是机器学习的一个重要分支，主要用来解决决策问题。强化学习可以在复杂的、不确定的环境中学习如何实现设定的目标，并且应用场景非常广，如控制机器人的电机让它执行特定任务、给商品定价或者进行库存管理、玩视频游戏或棋牌游戏等。深度学习算法如AlexNet,VggNet，ResNet等处理图像分类问题时，训练完成后参数就固定了，无法改变。而生产线上的图片是源源不断的、动态的，需要模型可以随时更新，故深度学习算法无法解决此类动态问题，而目前强化学习主要应用于处理游戏，没有适用于图像分类方向的算法。
技术实现思路
为了解决上述技术问题，本专利技术开拓性地提出了一种基于深度学习和强化学习的动态图像分类方法，结合LeNet模型的提取特征能力和强化学习算法中Qlearning的动态决策能力处理生产线上图片不断增加的问题。本专利技术所采用的技术方案是：一种动态图像分类方法，其特征在于，包括以下步骤：步骤1：获取若干图片，作为样本集；步骤2：将样本集分为若干子集；步骤3：从第一个子集中的图片中随机选取一张图作为输入经过LeNet模型逼近Q(s,a；θ)函数，其中s表示状态，a表示动作，θ表示LeNet模型的权重；步骤4：根据Q(s,a；θ)函数选取一个动作1或0，得到一个奖励和下...

【技术保护点】
1.一种动态图像分类方法，其特征在于，包括以下步骤：步骤1：获取若干图片，作为样本集；步骤2：将样本集分为若干子集；步骤3：从第一个子集中的图片中随机选取一张图作为输入经过LeNet模型逼近Q(s,a；θ)函数，其中s表示状态，a表示动作，θ表示LeNet模型的权重；步骤4：根据Q(s,a；θ)函数选取一个动作1或0，得到一个奖励和下一张图片；其中，1和0分别表示图片的2个对立的类别；所述得到一个奖励，如果分类正确，则+1分；如果分类错误，则‑1分；得分越高分类准确率越高；步骤5：根据奖励更新LeNet模型各层的权重从而得到新的LeNet模型；步骤6：得到的下一张图作为更新后LeNet模型的输入重复上述操作直到遍历第一个子集中的所有图片，保存模型；步骤7：将后一个子集中的图片添加到前面的子集中，回转执行步骤3；步骤8：对比每次的准确率；如果准确率下降，如果准确率下降，微调LeNet模型，所有的训练要重新开始，从第一个子集中的图片开始，回转执行步骤3；如果准确率增加或不变，则保存模型。

【技术特征摘要】
1.一种动态图像分类方法，其特征在于，包括以下步骤：步骤1：获取若干图片，作为样本集；步骤2：将样本集分为若干子集；步骤3：从第一个子集中的图片中随机选取一张图作为输入经过LeNet模型逼近Q(s,a；θ)函数，其中s表示状态，a表示动作，θ表示LeNet模型的权重；步骤4：根据Q(s,a；θ)函数选取一个动作1或0，得到一个奖励和下一张图片；其中，1和0分别表示图片的2个对立的类别；所述得到一个奖励，如果分类正确，则+1分；如果分类错误，则-1分；得分越高分类准确率越高；步骤5：根据奖励更新LeNet模型各层的权重从而得到新的LeNet模型；步骤6：得到的下一...

【专利技术属性】
技术研发人员：舒军，杨露，吴柯，蒋明威，李振亚，邓明舟，舒心怡，潘健，王淑青，
申请(专利权)人：湖北工业大学，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人