基于深度学习与强化学习的视频考勤系统及方法技术方案

技术编号:24331755 阅读:16 留言:0更新日期:2020-05-29 19:56
本发明专利技术公开了一种基于深度学习与强化学习的视频考勤系统及方法,所述系统包括:信息采样模块,用于获取训练数据和测试数据;训练模块,用于根据接收到的训练数据对深度神经网络架构进行训练,得到训练模型;测试模块,用于采用接收到的测试数据对训练模型进行测试,输出测试结果,并判别测试结果,输出判别信息;终端处理模块,当所述判别信息为成功时,其用于将与该判别信息相对应的测试结果存储至预先设有的数据库内;以及强化模块,当判别信息为失败时,用于将与测试结果所对应的所述测试数据对训练模型进行重新训练,更新训练模型。本发明专利技术解决了视频考勤过程等待过长、不能实现多人同时考勤、识别错误率高等技术问题。

Video attendance system and method based on deep learning and reinforcement learning

【技术实现步骤摘要】
基于深度学习与强化学习的视频考勤系统及方法
本专利技术涉及考勤管理
,特别涉及一种基于深度学习与强化学习的视频考勤系统及方法。
技术介绍
目前生活中存在的考勤系统多种多样,如利用GPS定位、通过APP签到、IC卡射频识别等一系列考勤方式,不过这些方式仍然存在着效率低下、检测不准确,甚至可以通过一些漏洞避免考勤、非法进入公司或者学校,造成巨大的损失。而视频考勤技术的出现,极大的改变了这种现状,然而目前的视频考勤技术普遍存在以下问题:问题一、视频考勤过程等待过长:机器提取图像、对比图像时间过长,导致不能很好的实现实时考勤。问题二、视频考勤不能实现多人同时考勤:目前视频考勤只能同一时间一个人进行考勤,会导致效率低下,等待时间过久。问题三、识别错误率高:当人的发型、光线明暗发生改变时,考勤判别错误率会提升。
技术实现思路
本专利技术的目的在于提供一种基于深度学习与强化学习的视频考勤系统及方法,通过深度学习与强化学习结合,实现多人考勤、及时响应和实时考勤的目的,从而解决视频考勤过程等待过长、不能实现多人同时考勤和识别错误率高等技术问题。为了解决以上问题,本专利技术通过以下技术方案实现:一种基于深度学习与强化学习的视频考勤系统,包括:信息采样模块,用于获取训练数据和测试数据;训练模块,用于根据接收到的所述训练数据对深度神经网络架构进行训练,得到训练模型;测试模块,用于采用接收到的所述测试数据对所述训练模型进行测试,输出测试结果,并判别所述测试结果,输出判别信息;终端处理模块,当所述判别信息为成功时,其用于将与该判别信息相对应的所述测试结果存储至预先设有的数据库内;以及强化模块,当所述判别信息为失败时,用于将与所述测试结果所对应的所述测试数据对所述训练模型进行重新训练,更新所述训练模型。可选地,所述信息采样模块包括摄像子单元和采集数据子单元;所述摄像子单元用于从摄像中录入人脸图像,得到样本数据;所述采集数据子单元用于将所述样本数据分为两路相同的数据,包括所述训练数据和所述测试数据,并分别将所述训练数据向所述训练模块进行传送,将所述测试数据向所述测试模块进行传送。可选地,所述训练模块包括:mtcnn子单元与facenet子单元;所述mtcnn子单元用于将接收到的所述训练数据中的图像样本进行不同尺度的缩放,构建图像金字塔,生成若干个候选窗口,通过卷积神经网络过滤非人脸候选窗口,输出若干个人脸关键点,得到的图像样本;所述facenet子单元用于接收所述图像样本,并将所述图像样本输入至深度神经网络架构,将所述深度神经网络架构输出的结果进行归一化处理,再计算三元损失函数获取模型梯度和损失,调整所述深度神经网络架构的参数,更新所述深度神经网络架构,得到所述训练模型。可选地,所述mtcnn子单元具体用于通过P-net网络所述若干个候选窗口,再使用非最大抑制技术,对所述若干个候选窗口进行第一次挑选,以挑选精确度高于第一预设值的候选窗口;通过R-net网络对挑选的所述候选窗口进行第二次挑选,以挑选精确度高于第二预设值的候选窗口,最后经第二次挑选的所述候选窗口通过O-net网络生成所述图像样本;所述facenet子单元具体用于通过将所述图像样本输入至所述深度神经网络架构进行训练;再将所述图像样本的图像特征进行归一化向量建立用来提取特征的embedding特征空间;通过计算embedding特征空间中的所述图像样本之间的特征向量的欧氏距离,获得三元组,计算三元损失函数,获取损失和梯度;调整所述深度神经网络架构的参数,更新所述深度神经网络架构,得到所述训练模型。可选地,所述测试模块包括:存储模型子单元和判断单元;所述存储模型子单元用于存储所述训练模型,并采用接收到的测试数据对当前的所述训练模型进行测试,输出测试结果;所述判断单元用于对所述测试结果进行判别,输出所述判别信息。可选地,所述终端处理模块包括后台处理子单元和员工端子单元;所述后台处理子单元用于当所述判别信息为成功时,其用于将与该判别信息相对应的所述测试结果存储至预先设有的数据库内,并向所述员工端子单元输出打卡信息;所述员工端子单元作为员工或客户与后台进行交互的界面,显示打卡信息,并且还用于补考勤和请假操作。可选地,所述强化模块包括蒙特卡洛算法子单元和更新单元;所述蒙特卡洛算法子单元用于当所述判别信息为失败时,将与所述测试结果所对应的所述测试数据对所述训练模型进行重新训练;所述更新单元用于更新所述训练模型,并将更新后的所述训练模型传输给所述存储模型子单元中。可选地,所述打卡信息包括迟到信息、早退信息和成功信息。另一方面,本专利技术还提供一种基于深度学习与强化学习的视频考勤方法,包括:步骤S1、获取训练数据和测试数据;步骤S2、根据接收到的所述训练数据对深度神经网络架构进行训练,得到训练模型;步骤S3、采用接收到的所述测试数据对所述训练模型进行测试,输出测试结果,并判别所述测试结果,输出判别信息;步骤S4、当所述判别信息为成功时,其用于将与该判别信息相对应的所述测试结果存储至预先设有的数据库内;以及步骤S5、当所述判别信息为失败时,用于将与所述测试结果所对应的所述测试数据对所述训练模型进行重新训练,更新所述训练模型。可选地,所述步骤S2包括:将接收到的所述训练数据中的图像样本进行不同尺度的缩放,构建图像金字塔,生成若干个候选窗口,通过卷积神经网络过滤非人脸候选窗口,输出若干个人脸关键点,得到的图像样本;将所述图像样本输入至深度神经网络架构,将所述深度神经网络架构输出的结果进行归一化处理,再计算三元损失函数获取模型梯度和损失,调整所述深度神经网络架构的参数,更新所述深度神经网络架构,得到所述训练模型。本专利技术与现有技术相比,具有以下优点:本专利技术提供的一种基于深度学习与强化学习的视频考勤系统,包括:信息采样模块,用于获取训练数据和测试数据;训练模块,用于根据接收到的所述训练数据对深度神经网络架构进行训练,得到训练模型;测试模块,用于采用接收到的所述测试数据对所述训练模型进行测试,输出测试结果,并判别所述测试结果,输出判别信息;终端处理模块,当所述判别信息为成功时,其用于将与该判别信息相对应的所述测试结果存储至预先设有的数据库内;以及强化模块,当所述判别信息为失败时,用于将与所述测试结果所对应的所述测试数据对所述训练模型进行重新训练,更新所述训练模型。由此可知,本专利技术通过深度学习与强化学习结合,实现多人考勤、及时响应、实时考勤,从而解决视频考勤过程等待过长、不能实现多人同时考勤、识别错误率高等技术问题。对视频考勤识别效率做出很大优化,其识别准确率也得到了极大的提高。附图说明图1为本专利技术一实施例提供的一种基于深度学习与强化学习的视频考勤系统的结构框图;图2为本专利技术一实施例提供的本文档来自技高网...

【技术保护点】
1.一种基于深度学习与强化学习的视频考勤系统,其特征在于,包括:/n信息采样模块,用于获取训练数据和测试数据;/n训练模块,用于根据接收到的所述训练数据对深度神经网络架构进行训练,得到训练模型;/n测试模块,用于采用接收到的所述测试数据对所述训练模型进行测试,输出测试结果,并判别所述测试结果,输出判别信息;/n终端处理模块,当所述判别信息为成功时,其用于将与该判别信息相对应的所述测试结果存储至预先设有的数据库内;以及/n强化模块,当所述判别信息为失败时,用于将与所述测试结果所对应的所述测试数据对所述训练模型进行重新训练,更新所述训练模型。/n

【技术特征摘要】
1.一种基于深度学习与强化学习的视频考勤系统,其特征在于,包括:
信息采样模块,用于获取训练数据和测试数据;
训练模块,用于根据接收到的所述训练数据对深度神经网络架构进行训练,得到训练模型;
测试模块,用于采用接收到的所述测试数据对所述训练模型进行测试,输出测试结果,并判别所述测试结果,输出判别信息;
终端处理模块,当所述判别信息为成功时,其用于将与该判别信息相对应的所述测试结果存储至预先设有的数据库内;以及
强化模块,当所述判别信息为失败时,用于将与所述测试结果所对应的所述测试数据对所述训练模型进行重新训练,更新所述训练模型。


2.如权利要求1所述的基于深度学习与强化学习的视频考勤系统,其特征在于,所述信息采样模块包括摄像子单元和采集数据子单元;
所述摄像子单元用于从摄像中录入人脸图像,得到样本数据;
所述采集数据子单元用于将所述样本数据分为两路相同的数据,包括所述训练数据和所述测试数据,并分别将所述训练数据向所述训练模块进行传送,将所述测试数据向所述测试模块进行传送。


3.如权利要求2所述的基于深度学习与强化学习的视频考勤系统,其特征在于,所述训练模块包括:mtcnn子单元与facenet子单元;
所述mtcnn子单元用于将接收到的所述训练数据中的图像样本进行不同尺度的缩放,构建图像金字塔,生成若干个候选窗口,通过卷积神经网络过滤非人脸候选窗口,输出若干个人脸关键点,得到的图像样本;
所述facenet子单元用于接收所述图像样本,并将所述图像样本输入至深度神经网络架构,将所述深度神经网络架构输出的结果进行归一化处理,再计算三元损失函数获取模型梯度和损失,调整所述深度神经网络架构的参数,更新所述深度神经网络架构,得到所述训练模型。


4.如权利要求3所述的基于深度学习与强化学习的视频考勤系统,其特征在于,所述mtcnn子单元具体用于通过P-net网络所述若干个候选窗口,再使用非最大抑制技术,对所述若干个候选窗口进行第一次挑选,以挑选精确度高于第一预设值的候选窗口;通过R-net网络对挑选的所述候选窗口进行第二次挑选,以挑选精确度高于第二预设值的候选窗口,最后经第二次挑选的所述候选窗口通过O-net网络生成所述图像样本;
所述facenet子单元具体用于通过将所述图像样本输入至所述深度神经网络架构进行训练;
再将所述图像样本的图像特征进行归一化向量建立用来提取特征的embedding特征空间;
通过计算embedding特征空间中的所述图像样本之间的特征向量的欧氏距离,获得三元组,计算三元损失函数,获取损失和梯度;调整所述深度神经网络架构的参...

【专利技术属性】
技术研发人员:马林朱昌明季翔梅成就罗军
申请(专利权)人:上海海事大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1