唇语识别模型的训练方法、活体识别方法及装置制造方法及图纸

技术编号：24685460 阅读：33 留言：0更新日期：2020-06-27 08:31

本申请公开了一种唇语识别模型的训练方法、活体识别方法及装置，活体识别方法包括：获取到待检测的视频数据；对视频数据进行预处理，得到视频数据对应的唇部区域图片；将唇部区域图片输入到训练好的基于深度学习的唇语识别模型中，通过唇语识别模型输出视频数据的读取内容；其中，唇语识别模型包括依次级联的3D卷积网络结构、2D卷积网络结构、GRU结构以及CTC损失函数；根据所述读取内容与指定内容的编辑距离确定所述视频数据是否是活体用户读取所述指定内容得到的视频数据。通过上述方式，能够快速准确的进行活体识别。

Training method, living recognition method and device of lip recognition model

全部详细技术资料下载

【技术实现步骤摘要】
唇语识别模型的训练方法、活体识别方法及装置
本申请涉及到活体识别
，特别是涉及一种唇语识别模型的训练方法、活体识别方法及装置。
技术介绍
随着互联网以及生物技术的快速发展，通过生物特征进行身份验证已经应用于各行各业。比如移动支付、门禁身份验证等等。而在生物特征识别中，常用的有指纹识别如手机解锁、虹膜识别以及人脸特征识别以及更为先进的活体检测等技术。活体检测一般是通过眨眼、张嘴、摇头、点头等组合动作结合人脸关键点定位、人脸追踪等技术来验证是否为真实活体本人。然而，由于这些检测技术并没有标准，很容易被破解或通过预先录制好的视频冒充。如何自动地、高效地辨别视频真伪即提供更为可靠的活体检测技术，以抵抗欺骗攻击，确保系统安全已成为一个迫切需要解决的问题。
技术实现思路
本申请主要解决的技术问题是提供一种基于深度学习的唇语识别模型的训练方法，能够快速准确的进行活体识别。为解决上述技术问题，本申请采用的第一个技术方案是：提供一种基于深度学习的唇语识别模型的训练方法，所述唇语识别模型用于活体...

【技术保护点】
1.一种基于深度学习的唇语识别模型的训练方法，其特征在于，所述唇语识别模型用于活体识别，所述唇语识别模型包括依次级联的3D卷积网络结构、2D卷积网络结构、GRU结构以及CTC算法结构，所述训练方法包括：/n获取到用户读取指定内容的视频数据；/n对所述视频数据进行预处理，得到所述视频数据对应的唇部区域图片；/n将所述唇部区域图片输入到基于深度学习的初始模型中，得到预测读取内容；/n通过所述CTC算法结构利用所述指定内容以及所述预测读取内容构建损失函数，通过所述损失函数确定是否对所述初始模型进行再训练，并将训练完成的模型确定为所述唇语识别模型。/n

【技术特征摘要】
1.一种基于深度学习的唇语识别模型的训练方法，其特征在于，所述唇语识别模型用于活体识别，所述唇语识别模型包括依次级联的3D卷积网络结构、2D卷积网络结构、GRU结构以及CTC算法结构，所述训练方法包括：
获取到用户读取指定内容的视频数据；
对所述视频数据进行预处理，得到所述视频数据对应的唇部区域图片；
将所述唇部区域图片输入到基于深度学习的初始模型中，得到预测读取内容；
通过所述CTC算法结构利用所述指定内容以及所述预测读取内容构建损失函数，通过所述损失函数确定是否对所述初始模型进行再训练，并将训练完成的模型确定为所述唇语识别模型。

2.一种活体识别方法，其特征在于，所述活体识别方法包括：
获取到待检测的视频数据；
对所述视频数据进行预处理，得到所述视频数据对应的唇部区域图片；
将所述唇部区域图片输入到训练好的基于深度学习的唇语识别模型中，通过所述唇语识别模型输出所述视频数据的读取内容；其中，所述唇语识别模型包括依次级联的3D卷积网络结构、2D卷积网络结构、GRU结构以及CTC算法结构；
根据所述读取内容与指定内容的编辑距离确定所述视频数据是否是活体用户读取所述指定内容得到的视频数据。

3.根据权利要求2所述的活体识别方法，其特征在于，所述对所述视频数据进行预处理，得到所述视频数据对应的唇部区域图片的步骤具体包括：
利用所述视频数据的声音起止时间剔除所述视频数据中设定时段的无声部分；
将剔除后的剩余部分视频数据拆分成帧图片，并从所述帧图片中得到唇部区域图片。

4.根据权利要求2所述的活体识别方法，其特征在于，所述将所述唇部区域图片输入到训练好的基于深度学习的唇语识别模型中，通过所述唇语识别模型输出读取内容的步骤包括：
将所述唇部区域图片输入到所述3D卷积网络结构中，通过所述3D卷积网络结构提取到所述唇部区域图片的第一特征矩阵；
通过reshape函数从所述第一特征矩阵中提取到所述唇语区域图片的不包括时间序列信息的部分特征矩阵；并将所述部分特征矩阵输入到所述2D卷积网络结构中，通过所述2D卷积网络结构对所述部分特征矩阵的特征提取能力进行增强，得到第二特征矩阵；
通过所述reshape函数对所述第二特征矩阵还原时间序列信息，得到第三特征矩阵；
将所述第三特征矩阵输入到所述GRU结构，通过所述GRU结构对所述第三特征矩阵中的时间序列信息的特征提取能力进行增强，得到第四特征矩阵；并将所述第四特征矩阵输入到全连接层进行处理，得到所述唇部...

【专利技术属性】
技术研发人员：赵幸福，孔志飞，赵立军，
申请(专利权)人：马上消费金融股份有限公司，
类型：发明
国别省市：重庆;50

全部详细技术资料下载我是这个专利的主人