在线笔迹认证中一种笔迹布局特征的提取及认证方法技术

技术编号:25599938 阅读:59 留言:0更新日期:2020-09-11 23:57
本发明专利技术公开了在线笔迹认证中一种笔迹布局特征的提取及认证方法,包括如下步骤:手写笔迹笔画布局特征预学习,收集手写笔迹样本,提取笔画布局特征,估算特征在人群中出现的联合概率密度函数;笔画布局特征注册,统计笔画布局特征在注册手写笔迹样本集合中的最大、最小值并依此找出稳定的布局特征;笔画布局特征认证,提取待认证用户提交的测试手写笔迹笔画布局特征,计算稳定且一致笔画布局特征组合在人群中出现的概率,作为进一步判别的依据。本发明专利技术在线笔迹认证中一种笔迹布局特征的提取及认证方法,能有效提取出那些处于局部的细小书写动作和习惯,并估算稳定且一致笔画布局特征在人群中出现的概率。

【技术实现步骤摘要】
在线笔迹认证中一种笔迹布局特征的提取及认证方法
本专利技术涉及信息安全领域,具体涉及在线笔迹认证中一种笔迹布局特征的提取及认证方法。
技术介绍
在线笔迹认证是指利用专门输入设备在线获取用户的手写笔迹,经比较其中所蕰涵的个性化特征从而实现用户身份鉴别的一项技术。所谓笔迹布局特征是指笔迹中各个笔画间位置远近和笔画长短的关系,就是书写好的汉字笔迹所呈现出来的样子。笔迹学研究发现,书写习惯一旦成形,笔迹外在的呈现形式即固定下来,且各具特色。由于表现形式的外在直观性,笔迹字形、布局特征是用来判别书写人是否同一的首选依据,因此布局特征的提取在笔迹认证中具有重要意义。与人类强大感知能力不同,机器在布局特征提取上要困难许多。我们生活在一个三维的物理空间。千百万年的进化使得我们人类拥有完美的空间方位感知能力,我们能快速感知到物体之间位置和形状上的细微变化。在笔迹鉴别方面,这种与生俱来的东西赋予我们绝佳的笔迹布局特征提取能力。摹仿一段笔迹,首先得通过我们这种感知能力这一关。得益于我们的天赋,即使没有经过专门训练的普通人仅凭直觉就能准确地区分哪些是摹仿笔迹。很自然地,在笔迹自动鉴别领域,我们希望赋予给机器同样的能力。与人脑所处理笔迹信息不同,机器面对的是经过采样得到的一组笔尖运动轨迹有序点集合。让机器感知笔迹布局特征的基础是自动识别出笔迹中各段笔画的类型,然后才能计算和比较同类型笔画之间的远近和长短关系。目前的笔迹布局特征提取主要是基于笔迹匹配算法的,这样做存在两个问题:1)匹配算法仅比较两个笔迹之间的笔画对应关系,而布局特征关注的是所有具有相同笔画类型的笔画之间的关系,如果直接采用匹配算法,那么在大规模数据集上,计算所有两两笔迹在时间上的开销是难以承受的;2)由于书写的随意性,匹配算法的正确性难以保证。除此之外,不同于指纹,笔迹特征不完全相同,即使自来同一书写者前后两次不同的书写也不完全相同。笔画特征的同一是统计意义上的同一。因此,我们必须采用统计方法来对笔迹的布局特征进行度量并做出同一性判别,统计方法的有效性依赖于同质对象上的数据规模,因此,笔画识别是笔迹布局特征提取绕不开的前提。
技术实现思路
本专利技术的目的就是针对上述技术的不足,提供在线笔迹认证中一种笔迹布局特征的提取及认证方法,能够克服笔迹两两匹配的巨额时间开销,有效提取大规模笔迹的笔画布局特征,基于布局特征在人群中的统计特征来提高认证系统的准确性和泛化能力。为实现上述目的,本专利技术所设计的在线笔迹认证中一种笔迹布局特征的提取及认证方法,包括如下步骤:A)手写笔迹笔画布局特征预学习:收集人群关于标准汉字c的大量的手写笔迹样本,基于笔画识别算法识别所有预学习手写笔迹样本中的笔画类型;然后提取每段笔画的布局特征、两两笔画之间的布局特征、两两笔画之间是否相交以及交叉点的布局特征;以所识别的笔画类型为对象,分析各种笔画布局特征在人群中出现的统计特征,对笔画布局的离散型特征,包括笔画类型、两两笔画相交的次数特征,统计这类特征在人群中出现的分布律;对笔画布局的连续型特征,包括交叉点的位置特征、两两笔画间的布局特征,估算这些特征在人群中出现的联合概率密度函数;所述手写笔迹样本是指通过专用的数据传感设备实时采集书写过程中笔尖运动产生的各种信息所获得的与时间相关的时序信号序列,专感器在每个采样时刻采集的数据包括笔尖的二维位置信息、笔尖施加在书定平面上的压力、笔杆与书写平面的转动角及夹角信息;所述每段笔画的布局特征是指笔迹中某一段笔画的方位角、包含该笔画的面积最小矩形的长度和宽度、笔画在书写平面中的位置特征,所述两两笔画之间的布局特征是指笔迹中任意两段笔画之间的其中一段笔画的起止点、交叉点相对另一段笔画的长度、夹角、重心距离特征;所述笔画的布局特征包括笔迹中所包含的所有笔画、笔画的起点和终点的位置、笔画之间的交叉点位置、笔迹中所有单笔画的布局特征、笔迹中所有两两笔画之间的布局特征;所述汉字c的手写笔迹样本是指书写人手写的可被其他人正确辩识的或只能被少数人辩识的或只能被书写者自己辩识为标准汉字c的非标准手写体笔迹,所谓辩识是指建立手写体笔迹与标准汉字之间的对应关系;所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;所述识别手写笔迹中的笔画类型是指建立手写笔迹中笔画与标准汉字中笔画的对应关系;B)笔画布局特征注册:注册用户书写并提交关于标准汉字c的若干注册手写笔迹样本,设若干所述注册手写笔迹样本组成注册手写笔迹样本集合,识别所有注册手写笔迹样本中的笔画类型,按所识别的笔画类型,提取每段笔画的布局特征、两两笔画之间的布局特征、两两笔画之间是否相交以及交叉点的布局特征,统计笔画布局特征中各种离散型特征在所有注册手写笔迹样本集合中出现和未出现的次数,统计笔画布局特征中各种连续型特征在注册手写笔迹样本集合中的最大、最小值;所述注册手写笔迹样本是指在注册阶段注册用户书写并提交的用户身份已知的手写笔迹,所述用户身份已知是指手写笔迹书写者的身份是已知的;C)笔画布局特征认证:待认证用户提交一个关于标准汉字c的测试手写笔迹样本,识别测试手写笔迹样本中的笔画类型,按所识别的笔画类型,统计测试手写笔迹样本中出现和未出现的笔画类型,统计两两笔画之间出现和未出现的交叉点,提取所有具有相同笔画类型的各种单笔画布局特征以及两两笔画间的布局特征,找出注册手写笔迹样本中稳定且一致的各种笔画布局特征,依据在手写笔迹笔画布局特征预学习阶段计算得到的关于标准汉字c所有各种笔画布局特征在人群中的统计特征,计算观测到测试手写笔迹样本与注册手写笔迹样本中所有稳定且一致的各种笔画布局特征的概率,依据计算得到的所述概率,结合其它笔画特征,包括笔画书写动态特征、笔顺、书写节奏,综合判断测试手写笔迹样本是否为真实笔迹;所述稳定且一致笔画布局特征包括离散型稳定且一致笔画布局特征和连续型稳定且一致笔画布局特征;所述离散型稳定且一致笔画布局特征是指,在测试手写笔迹样本中提取的离散型笔画布局特征取值与在注册手写笔迹样本集合中提取的稳定的离散型笔画布局特征取值是相同的,所述稳定的离散型笔画布局特征是指具有相同离散型笔画布局特征的特征取值在注册手写笔迹样本集合上出现次数大于一定阈值;所述连续型稳定且一致笔画布局特征是指,在测试手写笔迹样本中提取的连续型笔画布局特征取值处于在注册手写笔迹样本集合上提取的稳定的连续型笔画布局特征取值的最大最小值之间,所述稳定的连续型笔画布局特征是指在注册手写笔迹样本集合上提取的连续型笔画布局特征取值的最大最小值之间的距离小于一定阈值;所述测试手写笔迹样本是指在认证阶段待认证用户书写并提交的用户身份未知且有待确认的手写笔迹,所述用户身份未知是指还未确认书写手写笔迹的用户身份与模板笔迹的用户身份是否相一致,有待进一步确认;所述待认证用户是指真实身份未得到确认的用户。优选地,所述步骤A)中,手写笔迹笔画布局特征预学习包括如下步骤:A1)特征预学习开始:设S={s1,s2,本文档来自技高网
...

【技术保护点】
1.在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:包括如下步骤:/nA)手写笔迹笔画布局特征预学习:收集人群关于标准汉字c的大量的手写笔迹样本,基于笔画识别算法识别所有预学习手写笔迹样本中的笔画类型;然后提取每段笔画的布局特征、两两笔画之间的布局特征、两两笔画之间是否相交以及交叉点的布局特征;以所识别的笔画类型为对象,分析各种笔画布局特征在人群中出现的统计特征,对笔画布局的离散型特征,包括笔画类型、两两笔画相交的次数特征,统计这类特征在人群中出现的分布律;对笔画布局的连续型特征,包括交叉点的位置特征、两两笔画间的布局特征,估算这些特征在人群中出现的联合概率密度函数;/n所述手写笔迹样本是指通过专用的数据传感设备实时采集书写过程中笔尖运动产生的各种信息所获得的与时间相关的时序信号序列,专感器在每个采样时刻采集的数据包括笔尖的二维位置信息、笔尖施加在书定平面上的压力、笔杆与书写平面的转动角及夹角信息;/n所述每段笔画的布局特征是指笔迹中某一段笔画的方位角、包含该笔画的面积最小矩形的长度和宽度、笔画在书写平面中的位置特征,所述两两笔画之间的布局特征是指笔迹中任意两段笔画之间的其中一段笔画的起止点、交叉点相对另一段笔画的长度、夹角、重心距离特征;/n所述笔画的布局特征包括笔迹中所包含的所有笔画、笔画的起点和终点的位置、笔画之间的交叉点位置、笔迹中所有单笔画的布局特征、笔迹中所有两两笔画之间的布局特征;/n所述汉字c的手写笔迹样本是指书写人手写的可被其他人正确辩识的或只能被少数人辩识的或只能被书写者自己辩识为标准汉字c的非标准手写体笔迹,所谓辩识是指建立手写体笔迹与标准汉字之间的对应关系;/n所述识别手写笔迹中的笔画类型是指建立手写笔迹中笔画与标准汉字中笔画的对应关系;/nB)笔画布局特征注册:注册用户书写并提交关于标准汉字c的若干注册手写笔迹样本,设若干所述注册手写笔迹样本组成注册手写笔迹样本集合,识别所有注册手写笔迹样本中的笔画类型,按所识别的笔画类型,提取每段笔画的布局特征、两两笔画之间的布局特征、两两笔画之间是否相交以及交叉点的布局特征,统计笔画布局特征中各种离散型特征在所有注册手写笔迹样本集合中出现和未出现的次数,统计笔画布局特征中各种连续型特征在注册手写笔迹样本集合中的最大、最小值;/n所述注册手写笔迹样本是指在注册阶段注册用户书写并提交的用户身份已知的手写笔迹,所述用户身份已知是指手写笔迹书写者的身份是已知的;/nC)笔画布局特征认证:待认证用户提交一个关于标准汉字c的测试手写笔迹样本,识别测试手写笔迹样本中的笔画类型,按所识别的笔画类型,统计测试手写笔迹样本中出现和未出现的笔画类型,统计两两笔画之间出现和未出现的交叉点,提取所有具有相同笔画类型的各种单笔画布局特征以及两两笔画间的布局特征,找出注册手写笔迹样本中稳定且一致的各种笔画布局特征,依据在手写笔迹笔画布局特征预学习阶段计算得到的汉字c所有各种笔画布局特征在人群中的统计特征,计算观测到测试手写笔迹样本与注册手写笔迹样本中所有稳定且一致的各种笔画布局特征的概率,依据计算得到的所述概率,结合其它笔画特征,包括笔画书写动态特征、笔顺、书写节奏,综合判断测试手写笔迹样本是否为真实笔迹;/n所述稳定且一致笔画布局特征包括离散型稳定且一致笔画布局特征和连续型稳定且一致笔画布局特征;/n所述离散型稳定且一致笔画布局特征是指,在测试手写笔迹样本中提取的离散型笔画布局特征取值与在注册手写笔迹样本集合中提取的稳定的离散型笔画布局特征取值是相同的,所述稳定的离散型笔画布局特征是指具有相同离散型笔画布局特征的特征取值在注册手写笔迹样本集合上出现次数大于一定阈值;/n所述连续型稳定且一致笔画布局特征是指,在测试手写笔迹样本中提取的连续型笔画布局特征取值处于在注册手写笔迹样本集合上提取的稳定的连续型笔画布局特征取值的最大最小值之间,所述稳定的连续型笔画布局特征是指在注册手写笔迹样本集合上提取的连续型笔画布局特征取值的最大最小值之间的距离小于一定阈值;/n所述测试手写笔迹样本是指在认证阶段待认证用户书写并提交的用户身份未知且有待确认的手写笔迹,所述用户身份未知是指还未确认书写手写笔迹的用户身份与模板笔迹的用户身份是否相一致,有待进一步确认;/n所述待认证用户是指真实身份未得到确认的用户。/n...

【技术特征摘要】
1.在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:包括如下步骤:
A)手写笔迹笔画布局特征预学习:收集人群关于标准汉字c的大量的手写笔迹样本,基于笔画识别算法识别所有预学习手写笔迹样本中的笔画类型;然后提取每段笔画的布局特征、两两笔画之间的布局特征、两两笔画之间是否相交以及交叉点的布局特征;以所识别的笔画类型为对象,分析各种笔画布局特征在人群中出现的统计特征,对笔画布局的离散型特征,包括笔画类型、两两笔画相交的次数特征,统计这类特征在人群中出现的分布律;对笔画布局的连续型特征,包括交叉点的位置特征、两两笔画间的布局特征,估算这些特征在人群中出现的联合概率密度函数;
所述手写笔迹样本是指通过专用的数据传感设备实时采集书写过程中笔尖运动产生的各种信息所获得的与时间相关的时序信号序列,专感器在每个采样时刻采集的数据包括笔尖的二维位置信息、笔尖施加在书定平面上的压力、笔杆与书写平面的转动角及夹角信息;
所述每段笔画的布局特征是指笔迹中某一段笔画的方位角、包含该笔画的面积最小矩形的长度和宽度、笔画在书写平面中的位置特征,所述两两笔画之间的布局特征是指笔迹中任意两段笔画之间的其中一段笔画的起止点、交叉点相对另一段笔画的长度、夹角、重心距离特征;
所述笔画的布局特征包括笔迹中所包含的所有笔画、笔画的起点和终点的位置、笔画之间的交叉点位置、笔迹中所有单笔画的布局特征、笔迹中所有两两笔画之间的布局特征;
所述汉字c的手写笔迹样本是指书写人手写的可被其他人正确辩识的或只能被少数人辩识的或只能被书写者自己辩识为标准汉字c的非标准手写体笔迹,所谓辩识是指建立手写体笔迹与标准汉字之间的对应关系;
所述识别手写笔迹中的笔画类型是指建立手写笔迹中笔画与标准汉字中笔画的对应关系;
B)笔画布局特征注册:注册用户书写并提交关于标准汉字c的若干注册手写笔迹样本,设若干所述注册手写笔迹样本组成注册手写笔迹样本集合,识别所有注册手写笔迹样本中的笔画类型,按所识别的笔画类型,提取每段笔画的布局特征、两两笔画之间的布局特征、两两笔画之间是否相交以及交叉点的布局特征,统计笔画布局特征中各种离散型特征在所有注册手写笔迹样本集合中出现和未出现的次数,统计笔画布局特征中各种连续型特征在注册手写笔迹样本集合中的最大、最小值;
所述注册手写笔迹样本是指在注册阶段注册用户书写并提交的用户身份已知的手写笔迹,所述用户身份已知是指手写笔迹书写者的身份是已知的;
C)笔画布局特征认证:待认证用户提交一个关于标准汉字c的测试手写笔迹样本,识别测试手写笔迹样本中的笔画类型,按所识别的笔画类型,统计测试手写笔迹样本中出现和未出现的笔画类型,统计两两笔画之间出现和未出现的交叉点,提取所有具有相同笔画类型的各种单笔画布局特征以及两两笔画间的布局特征,找出注册手写笔迹样本中稳定且一致的各种笔画布局特征,依据在手写笔迹笔画布局特征预学习阶段计算得到的汉字c所有各种笔画布局特征在人群中的统计特征,计算观测到测试手写笔迹样本与注册手写笔迹样本中所有稳定且一致的各种笔画布局特征的概率,依据计算得到的所述概率,结合其它笔画特征,包括笔画书写动态特征、笔顺、书写节奏,综合判断测试手写笔迹样本是否为真实笔迹;
所述稳定且一致笔画布局特征包括离散型稳定且一致笔画布局特征和连续型稳定且一致笔画布局特征;
所述离散型稳定且一致笔画布局特征是指,在测试手写笔迹样本中提取的离散型笔画布局特征取值与在注册手写笔迹样本集合中提取的稳定的离散型笔画布局特征取值是相同的,所述稳定的离散型笔画布局特征是指具有相同离散型笔画布局特征的特征取值在注册手写笔迹样本集合上出现次数大于一定阈值;
所述连续型稳定且一致笔画布局特征是指,在测试手写笔迹样本中提取的连续型笔画布局特征取值处于在注册手写笔迹样本集合上提取的稳定的连续型笔画布局特征取值的最大最小值之间,所述稳定的连续型笔画布局特征是指在注册手写笔迹样本集合上提取的连续型笔画布局特征取值的最大最小值之间的距离小于一定阈值;
所述测试手写笔迹样本是指在认证阶段待认证用户书写并提交的用户身份未知且有待确认的手写笔迹,所述用户身份未知是指还未确认书写手写笔迹的用户身份与模板笔迹的用户身份是否相一致,有待进一步确认;
所述待认证用户是指真实身份未得到确认的用户。


2.根据权利要求1所述在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:所述步骤A)中,手写笔迹笔画布局特征预学习包括如下步骤:
A1)特征预学习开始:设S={s1,s2,...,sN}表示海量的足够多书写者手写的关于标准汉字c的笔迹样本集合,每位书写者提供1至3个样本,设T={t1,t2,...,tO}表示汉字c包含的所有基本笔画集合,O表示标准汉字c所包含的基本笔画数;所述标准汉字c是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
A2)初始化:置循环变量i=1,置标准汉字c的第j段笔画在预训练样本集S中出现的次数计数变量nj=0,1≤j≤O,置标准汉字c的第j段笔画在预训练样本集S中未出现的次数计数变量1≤j≤O,置同时包含两段特定笔画类型的统计量N1O×O=0O×O,其中矩阵元素n1kj表示预训练样本集S中同时包含两段笔画被分别识别为第k段和第j段笔画类型的预训练笔迹样本个数,1≤k≤O,1≤j≤O,置笔画相交统计矩阵和未相交统计矩阵RO×O=0O×O,其中rij表示在预训练样本集S中具有这种特性的笔迹样本个数,表示预训练样本集S中不具有这种特性的笔迹样本个数,所述特性是指在该笔迹样本中被识别为标准汉字c的第i和第j段的两段笔画之间相交,初始化总体被识别为第k段类型的单笔画布局特征集合GF1k为空,k=1,2,...,O,初始化总体两两笔画间的布局特征集合矩阵GF2O×O中每一个元素GF2kj为空,1≤k≤O,1≤j≤O,其中矩阵的第k行第j列元素GF2kj表示预训练样本集S中被识别为第k段和第j段笔画之间的布局特征集合;
A3)识别第i个预训练样本si的笔画类型,并更新统计量:对预训练样本si按笔画进行分割,得到笔画序列识别si中每一段笔画的类型,设表示返回的笔画类型识别结果,其中ok表示预训练样本si中的第k段笔画被识别为标准汉字c的第ok段笔画,1≤ok≤O,ni表示si中的笔画数,O表示标准汉字c包含的基本笔画数,若第k段笔画出现在预训练样本si中,则计数变量nk=nk+1,否则,变量k从标准汉字c的第1段笔画开始到标准汉字c最后一段笔画结束,一轮循环后,完成预训练样本si对统计量nk和的更新,为了计算交叉点出现频率,更新统计量N1O×O,若预训练样本si中存在两段笔画被分别识别为第k段和第j段笔画类型,则n1kj=n1kj+1,其中n1为矩阵N1O×O第k行第j列元素,按从左到右,从上到下的顺序完成预训练样本si对统计量N1O×O的更新;
A4)预训练样本si中两两笔画交叉点计算:以预训练样本si的笔画序列笔画类型识别结果人工标注的标准汉字c中应相交笔画矩阵CO×O作为输入参数,得到预训练样本si的两两笔画间交叉点矩阵PO×O,和与预训练样本si中被识别为第k段笔画相交的交叉点集合Wk,k=1,2,...,O;若预训练样本si中被识别为第k段和第j段笔画不相交,那么交叉点矩阵PO×O中元素ptkj=0,交叉点集合Wk和Wj中交叉点pkj=(null,null)和pjk=(null,null);否则,交叉点矩阵PO×O中元素ptkj=1,交叉点集合Wk和Wj中交叉点pkj和pjk为叉交点二维坐标,1≤j≤O,1≤k≤O;
A5)笔画交叉信息的统计量更新:从步骤A4)返回的两两笔画间交叉点矩阵PO×O的第1行第1列元素开始,按从左到右,从上到下的顺序,逐个读取PO×O的元素,若预训练样本sk中存在两段笔画被分别识别为第k和第j笔画类型,ptkj=1且pkj=(null,null),那么否则,若pkj≠(null,null),表示相应的两段笔画有相交,rkj=rkj+1,双重循环结束后,完成预训练样本si对统计量矩阵RO×O和的更新;
A6)预训练样本si中单个笔画的布局特征计算:以预训练样本si的笔画序列笔画类型识别结果作为输入参数,得到预训练样本si的被识别为第k段笔画类型的笔画布局特征向量F1k,k=1,2,...,O;若预训练样本si中存在笔画被识别为第k段笔画类型,则F1k=(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU);否则,F1k=null,1≤k≤O;
A7)单笔画布局特征统计量的更新:将在预训练样本si上得到的各个笔画布局特征向量F1k,k=1,2,...,O添加到相应的总体单笔画布局特征集合中去GF1k,从第一段笔画开始到第O段笔画结束,若F1k==null,表示预训练样本si中没有笔画被识别为第k段笔画类型,不用更新,否则,GF1k=GF1k∪{F1k},循环结束后,完成对总体单笔画布局特征集合GF1k的更新,k=1,2,...,O;
A8)预训练样本si中两两笔画间的布局特征计算:具体地,以预训练样本si的笔画序列笔画类型识别结果与预训练样本si中被识别为第k段笔画相交的交叉点集合Wk,k=1,2,...,O,预训练样本si中两两笔画间的交叉点矩阵PO×O作为输入参数,得到预训练样本si的两两笔画间布局特征向量矩阵F2O×O,若预训练样本si中存在两段笔画被识别为第k段和第j段笔画类型,则f2kj=(DisTS,DispTS,AngleTS,TD,R,P1U,PcU,PTU);否则,f2kj=null,k=1,2,...,O,1≤j≤O;
A9)两两笔画间布局特征统计量的更新:将在预训练样本si上得到的两两笔画间布局特征向量矩阵F2O×O,添加到相应的总体两两笔画间布局特征集合矩阵中去GF2O×O,从步骤A8)返回的两两笔画间布局特征向量矩阵F2O×O的第1行第1列元素开始,按从左到右,从下到下的顺序,逐个读取F2O×O的第k行第j列元素f2kj,若f2kj≠null,则GF2kj=GF2kj∪{f2kj};否则不用更新该统计量GF2kj;循环结束后,完成对总体两两笔画间布局特征集合GF2kj的更新;
A10)i=i+1,若i≤N,则跳转至步骤A3),否则,则跳转至步骤A11);
A11)人群中关于标准汉字c的单笔画布局特征联合概率密度函数的估计:以总体单笔画布局特征集合GF1k为训练样本,采用统计学习的方法估算人群中关于标准汉字c的被识别为第k段笔画的单笔画布局特征概率密度函数f1k(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU),1≤k≤O;
A12)人群中关于标准汉字c的两两笔画间布局特征联合概率密度函数的估计:对总体两两笔画间布局特征集合矩阵GF2O×O中的每一个元素GF2kj,1≤k≤O,1≤j≤O,按集合中每个向量的两矩阵位置关系类型分量划分成若干个互不相交的子集合子集表示集合GF2kj中所有两矩阵位置关系类型为u的两两笔画间布局特征向量集合,1≤u≤N1,N1表示两矩阵位置关系类型的类别数,所分得的各子集合具有以下特性:1)2)当u≠v时,统计每一个矩阵位置关系类别出现的频率其中表示集合中元素的个数,最后,在每一个特征向量子集上,采用统计学习的方法估算人群中关于标准汉字c的被识别为第k段和第j段笔画之间矩阵位置关系类型为u的两两笔画布局特征概率密度函数采用相同的方法,从集合矩阵GF2O×O的第1行第1列元素开始,按从左到右,从上到下的顺序,对矩阵中每一个元素GF2kj做同样的操作,1≤k≤O,1≤j≤O,得到相应的两两笔画布局特征概率密度函数
A13)结束:关于标准汉字c的预训练过程结束,返回的数据包括:1)标准汉字c的第k段类型笔画在人群中出现和未出现的频率nk/N和2)人群书写关于标准汉字c的手写笔迹中两两类型笔画相交和未相交笔迹出现的频率ri×j/n1ij和3)人群书写的标准汉字c的第k段类型笔画的单笔画布局特征联合概率密度函数f1k(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU),1≤k≤O;4)预训练手写笔迹样本集合中具有该特性的样本个数5)人群书写的关于标准汉字c的具有该特性的两两笔画类型布局特征联合概率密度函数所述具有该特性是指预学习手写笔迹样本中存在笔画被识别为第k和第j段笔画类型,且包含该两段类型笔画的面积最小的两矩形位置关系类型为u。


3.根据权利要求2所述在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:所述步骤B)中,笔画布局特征注册包括如下步骤:
B1)注册开始:用户提交关于标准汉字c的注册手写笔迹样本集合H={h1,h2,...,hp},p≥3
B2)初始化:置循环变量i=1,置标准汉字c的第j段笔画在注册手写笔迹样本集合H中出现的次数计数变量Ej=0,1≤j≤O,置标准汉字c的第j段笔画在注册手写笔迹样本集合H中未出现的次数计数变量置注册手写笔迹样本集合H的笔画相交统计矩阵和未相交统计矩阵VO×O=0O×O,其中vij、分别表示在手写笔迹样本集合H中具有和不具有这种特性的笔迹样本个数,所述特性是指在该笔迹样本中有被识别为标准汉字c的第i和第j段的两段笔画且这两段笔画相交;初始化集合H中被识别为第k段类型的单笔画布局特征集合GF3k为空,k=1,2,...,O,初始化集合H中两两笔画间的布局特征集合矩阵GF4O×O中每一个元素GF4kj为空,1≤k≤O,1≤j≤O,其中矩阵的第k行第j列元素GF4kj表示被识别为第k段和第j段笔画之间的布局特征集合,O表示汉字c标准书写体所包含的基本笔画数;
B3)识别第i个注册样本hi的笔画类型:对注册样本hi按笔画进行分割,得到笔画序列识别hi中每一段笔画的类型,设表示返回的笔画类型识别结果,其中ok表示注册样本hi中的第k段笔画被识别为标准汉字c的第ok段笔画,1≤ok≤O,ni表示hi中的笔画数,O表示标准汉字c包含的基本笔画数,若第k段笔画出现在注册样本hi中,则计数变量Ek=Ek+1,否则,变量k从标准汉字c的第1段笔画开始到标准汉字c最后一段笔画结束,一轮循环后,完成注册样本hi对统计量Ek和的更新;
B4)注册样本hi中两两笔画交叉点计算:以注册样本hi的笔画序列笔画类型识别结果人工标注的标准汉字c中应相交笔画矩阵CO×O作为输入参数,得到注册样本hi的两两笔画间交叉点矩阵PO×O,和与注册样本hi中被识别为第k段笔画相交的交叉点集合Wk,k=1,2,...,O;若注册样本hi中被识别为第k段和第j段笔画不相交,那么交叉点矩阵PO×O中元素ptkj=0,交叉点集合Wk和Wj中交叉点pkj=(null,null)和pjk=(null,null);否则,交叉点矩阵PO×O中元素ptkj=1,交叉点集合Wk和Wj中交叉点pkj和pjk为叉交点二维坐标,1≤j≤O,1≤k≤O;
B5)笔画相交信息的统计量更新:从B4)返回的两两笔画间交叉点矩阵PO×O的第1行第1列元素开始,按从左到右,从上到下的顺序,逐个读取PO×O的元素,若注册样本hi中存在笔画被识别为第k和第j笔画类型,且ptkj==1和pkj=(null,null),那么否则,若pkj≠(null,null),表示相应的两段笔画有相交,vkj=vkj+1,双重循环结束后,完成注册样本hi对统计量矩阵VO×O和的更新;
B6)注册样本hi中单个笔画的布局特征计算:以注册样本hi的笔画序列笔画类型识别结果作为输入参数,得到注册样本hi的被识别为第k段笔画类型的笔画布局特征向量F3k,1≤k≤O;若注册样本hi中存在笔画被识别为第k段笔画类型,则F3k=(xg,yg,a,b,Angle,Ux,Uy,P1U,PcU);否则,F3k=null,1≤k≤O;
B7)单笔画布局特征统计量的更新:将在注册样本hi上得到的各个笔画布局特征向量F3k,k=1,2,...,O添加到相应的关于注册笔迹样本集H的单笔画布局特征集合中去GF3k,从第一段笔画开始到第O段笔画结束,若F3k==null,表示注册样本hi中没有笔画被识别为第k段笔画类型,不用更新,否则,GF3k=GF3k∪{F3k},循环结束后,完成关于注册笔迹样本集H的单笔画布局特征集合GF3k的更新,k=1,2,...,O;
B8)注册样本hi中两两笔画间的布局特征计算:以注册样本hi的笔画序列笔画类型识别结果与注册样本hi中被识别为第k段笔画相交的交叉点集合Wk,k=1,2,...,O,注册样本hi中两两笔画间的交叉点矩阵PO×O为输入参数,得到注册样本hi的两两笔画间布局特征向量矩阵F4O×O;若注册样本hi中存在两段笔画被识别为第k段和第j段笔画类型,则否则,
B9)两两笔画间布局特征统计量的更新:将在注册样本hi上得到的两两笔画间布局特征向量矩阵F4O×O,添加到相应的关于注册笔迹样本集H的两两笔画间布局特征集合矩阵中去GF4O×O,从步骤208返回的两两笔画间布局特征向量矩阵F4O×O的第1行第1列元素开始,按从左到右,从下到下的顺序,逐个读取F4O×O的第k行第j列元素f4kj,若f4kj≠null,则GF4kj=GF4kj∪{f4kj};否则不用更新该统计量GF4kj;循环结束后,完成关于注册笔迹样本集H的两两笔画间布局特征集合GF4O×O的更新;
B10)i=i+1,若i≤p,则跳转至步骤B3),否则,则跳转至步骤B11);
B11)注册笔迹样本集H关于标准汉字c的单笔画布局特征在各个分量上的最大最小值:对于集合GF3k,GF3k表示以注册笔迹样本集H中由所有被识别为第k段类型笔画的单笔画布局特征构成的集合,计算单笔画布局特征的每一个分量在集合GF3k上的最大最小值,1≤k≤O;如果集合GF3k中元素个数小于2,那么最大最小值集合MF3k=null,否则用表示所求得的每个分量上的最大最小值集合,其中表示与第k段类型笔画相关的单笔画布局特征向量中第u个分量在注册笔迹样本集H上的最大值,表示与第k段类型笔画相关的单笔画布局特征向量中第u个分量的最小值,1≤u≤N2,1≤k≤O,N2表示单笔画布局特征向量中分量的个数,此步骤结束后,得到注册笔迹样本集H关于标准汉字c所有笔画的单笔画布局特征在各个分量上的最大最小值集合
B12)注册笔迹样本集H关于标准汉字c的两两笔画间布局特征在各个分量上的最大最小值:对注册笔迹样本集H上两两笔画间布局特征集合矩阵GF4O×O中的每一个元素GF4kj,1≤k≤O,1≤j≤O,按集合中每个向量的两矩阵位置关系类型分量划分成若干个互不相交的子集合子集表示集合GF4kj中所有两矩阵位置关系类型为u的两两笔画间布局特征向量集合,1≤u≤N1,N1表示两矩阵位置关系类型的类别数,所分得的各子集合具有以下特性:1)2)当u≠v时,统计每一个矩阵位置关系类别出现的次数,设表示集合中元素的个数;对于集合若那么否则,计算两两笔画间布局特征的每一个分量在集合上的最大最小值,1≤u≤N1,设表示所求得的每个分量上的最大最小值集合,其中表示被识别为第k和第j段类型的两段笔画的布局特征向量中第v个分量在两矩阵位置关系类型为u所有向量上的最大值,表示被识别为第k和第j段类型的两段笔画的布局特征向量中第v个分量在两矩阵位置关系类型为u所有向量上的最小值,1≤u≤N1,1≤v≤N4,1≤k≤O,1≤j≤O,N4表示单笔画布局特征向量中分量的个数;
B13)结束:关于标准汉字c的注册过程结束,返回的数据包括:1)第k段笔画在注册笔迹样本集H中出现和未出现的次数Ek和2)笔画相交点在注册笔迹样本集H中出现和未出现的次数矩阵vkj和3)注册笔迹样本集H关于标准汉字c所有笔画的单笔画布局特征在各个分量上的最大最小值集合其中,N2表示单笔画布局特征向量中分量的个数;4)具有特定性质的注册笔迹样本个数所述具有特定性质的注册样本是指:a)来自于注册笔迹样本集H;b)所述注册笔迹样本中包含有被识别为第k和第j段类型两段笔画;c)包含第k和第j段类型两段笔画的矩形之间的位置关系类型为u;5)在具有上述a)b)c)三种性质的注册笔迹样本子集上提取的两两笔迹间布局特征向量,在所述特征向量的每个分量上的最大最小值


4.根据权利要求3所述在线笔迹认证中一种笔迹布局特征的提取及认证方法,其特征在于:所述步骤C)中,笔画布局特征认证包括如下步骤:
C1)认证阶段开始:用户输入关于标准汉字c的测试手写笔迹样本W;
C2)初始化:置标准汉字c的第j段笔画在测试手写笔迹样本W中出现的次数计数变量yj=0,1≤j≤O,置标准汉字c的第j段笔画在测试手写笔迹样本W中未出现的次数计数变量置注册手写笔迹样本集合H的笔画相交统计矩阵和未相交统计矩阵ZO×O=0O×O,其中zij、分别表示在测试手写笔迹样本W中具有和不具有这种特性的笔迹样本个数,所述特性是指在该笔迹样本中被识别为标准汉字c的第i和第j段的两段笔画之间相交;
C3)识别测试手写笔迹样本W的笔画类型,并更新统计量:对测试手写笔迹样本W按笔画进行分割,得到笔画序列识别笔迹W中每一段笔画的类型,设表示返回的笔画类型识别结果,其中ok表示测试手写笔迹样本W中的第k段笔画被识别为标准汉字c的第ok段笔画,1≤ok≤O,nw表示W中的笔画数,O表示标准汉字c包含的基本笔画数,若第k段笔画出现在测试手写笔迹样本W中,则计数变量yk=yk+1,否则,变量k从标准汉字c的第1段笔画开始到标准汉字c最后一段笔画结束,一轮循环后,完成测试手写笔迹样本W对统计量yk和的更新;
C4)测试手写笔迹样本W中两两笔画交叉点计算:以测试手写笔迹样本W的笔画序列笔画类型识别结果人工标注的标准汉字c中应相交笔画矩阵CO×O作为输入参数,得到测试手写笔迹样本W的两两笔画间交叉点矩阵QO×O,和与测试手写笔迹样本W中被识别为第k段笔画相交的交叉点集合Xk,k=1,2,...,O;若测试手写笔迹样本W中被识别为第k段和第j段笔画不相交,那么交叉点矩阵QO×O中元素qtkj=0,交叉点集合Xk和Xj中交叉点qkj=(null,null)和qjk=(null,null);否则,交叉点矩阵QO×O中元素qtkj=1,交叉点集合Xk和Xj中交叉点qkj和qjk为叉交点二维坐标,1≤j≤O,1≤k≤O;
C5)笔画交叉信息的统计量更新:从步骤C4)返回的两两笔画间交叉点矩阵QO×O的第1行第1列元素开始,按从左到右,从上到下的顺序,逐个读取QO×O的元素,若...

【专利技术属性】
技术研发人员:邹杰王春枝
申请(专利权)人:湖北工业大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1