基于掩码预训练模型的签名特征识别方法、系统、设备及存储介质技术方案

技术编号:30172139 阅读:32 留言:0更新日期:2021-09-25 15:30
本发明专利技术请求保护一种基于掩码预训练模型的手写数据签名识别方法,涉及数据识别处理技术领域,通过提取在终端设备书写产生的多种书写特征信息;对多种特征序列进行预处理,获得固定长度的多种特征数据序列;掩盖屏蔽特征数据序列中的部分特征值;将被掩盖了部分特征值的多种特征数据序列转化为对应特征的特征向量,叠加全部特征向量并进行层归一化处理和编码,提取被掩盖部分对应的特征序列,并结合预先定义的目标值确定均方误差函数,通过均方误差函数更新预测模型网络权重,构建预测模型对书写笔迹特征进行识别。本发明专利技术可广泛应用于电子签名识别。子签名识别。子签名识别。

【技术实现步骤摘要】
基于掩码预训练模型的签名特征识别方法、系统、设备及存储介质


[0001]本专利技术涉及手写签名数据的识别技术,具体是一种基于预训练模型的手写在线签字数据识别技术。

技术介绍

[0002]自从数字时代的到来,手写在线签字在政府、商业、金融邻域作为电子数据的存证,为电子数据增强了可认证性。在线签名数据具有实时认证的特点,只要用户签下自己的名字,系统即可识别,但是对于不同的任务需要训练不同的模型,这样增加了成本,降低了生产效率。本文提出了基于掩码的预训练模型,能够对相似任务进行迁移学习,降低了工业成本,提高了生产效率。
[0003]手写签名的掩码预训练模型来自于基于掩码的自然语言处理预训练模型、基于图像识别的预训练模型,它们能够在后面的相似的任务进行迁移学习,通过少量样本即可得到较好的结果,可以有效解决在线手写签名邻域数据不足的问题。虽然存在基于图像在线签名识别的预训练技术,但是它只考虑了图像的各个像素,忽略了大量的有用信息,比如签名者的速度、压力等。现有技术在手写签名识别的预训练方面缺陷相关解决方案。
[0004]公开号CN 106本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于掩码预训练模型的电子签名识别方法,其特征在于,提取在终端设备书写所产生的多种书写特征信息;对多种特征信息进行预处理,获得固定长度的多种特征数据序列;掩码掩盖特征数据序列中的部分特征值;将被掩盖了部分特征值的多种特征数据序列转化为特征向量,叠加全部特征向量并进行层归一化处理,然后进行编码处理获得书写特征编码输出,根据各个书写特征编码输出与真实标签计算损失函数,对预训练模型的网络权重进行迭代更新,直到损失函数收敛,获得预训练模型最终的网络权重,根据权重构建训练模型完成对书写笔迹特征的识别。2.根据权利要求1所述的方法,其特征在于,利用签名者书写的连续过程,将书写特征信息转换为随时间变化的固定长度的特征序列,每一输入组件对应一种书写特征,当向输入层输入特征数据为非定时长序列时,时间为必须输入的特征。3.根据权利要求1或2所述的方法,其特征在于,当特征序列数据长度不足预训练模型规定的输入数据长度时,对特征序列数据填充零的方式补足所缺的数据;当特征序列数据长度大于模型输入长度时,以相对时间为X轴,其他书写特征为Y轴建立坐标系,获得书写状态和时间的对应关系曲线图,以极值作为数据分段,对每一个分段进行等距离采样。4.根据权利要求1或2所述的方法,其特征在于,将编码输出值与真实标签Y(label)带入公式:得均方误差函数loss,均方误差函数作为损失函数对预训练模型网络的当前权重W
i
求偏导得到当前权重导数W
i

,调用公式W
(i+1)
=W
i

lr*W
i

获得下一时刻网络权重,更新迭代模型网络权重,其中,n为书写特征序列长度,x(i)、y(i)、p(i)、t(i)为书写笔迹特征横坐标、纵坐标、压力、时间编码输出,Ylabel(x)、Ylabel(y)、Ylabel(p)、Ylabel(t)为书写笔迹序列在该位置各特征对应的真实标签,lr为学习率。5.一种基于掩码预训练模型的电子签名识别系统,其特征在于,该系统包括:数据采集模块、数据预处理模块、掩码模型、预训练模型,数据采集模块提取在终端设备书写产生的随时间变化的特征数据序列构成的多种书写特征信息;数据预处理模块对多种特征信息进行预处理,获得固定长度的特征数据序列;掩码模型通过掩码掩盖特征数据序列中的部分特征值;预训练模型对被掩码掩盖了...

【专利技术属性】
技术研发人员:吴乐琴覃勋辉曾川刘科
申请(专利权)人:傲雄在线重庆科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1