本发明专利技术涉及信息安全领域,公开了在线笔迹认证中笔画提连笔特征的提取及认证方法,包括如下步骤:笔画提连笔特征预学习,取得虚提笔和连笔特征在人群中出现的概率,笔画提连笔特征注册,统计注册用户笔画虚提笔和连笔特征的出现频率并依此找出稳定的虚提笔和连笔,笔画提连笔特征认证,计算稳定且一致虚提笔和连笔笔画组合在人群中出现的概率,依此概率的大小作为进一步判别的依据。本发明专利技术在线笔迹认证中笔画提连笔特征的提取及认证方法,能有效提取出处于局部笔画的虚提笔或连笔特征,并估算稳定且一致虚提笔和连笔笔画组合在人群中出现的概率,有助于识别出违反书写规范且稳定的书写方式,提升笔迹认证性能。
Feature extraction and authentication method of stroke lifting and linking in online handwriting authentication
【技术实现步骤摘要】
在线笔迹认证中笔画提连笔特征的提取及认证方法
本专利技术涉及信息安全领域,具体涉及在线笔迹认证中笔画提连笔特征的提取及认证方法。
技术介绍
在线笔迹认证是指利用专门输入设备在线获取用户的手写笔迹,经比较其中所蕰涵的个性化特征从而实现用户身份鉴别的一项技术。文字是思想的载体,而笔迹是文字的表现形式。在文字漫长的演化过程中,为了方便辨识和交流,书写规范逐步形成。所谓书写规范是指人们在文字书写时应遵守的规则,包括汉字的结构构成,笔画的相对位置关系、笔画的书写顺序和书写方式等。从幼儿开始的习字过程就是在不断学习符合书写规范从而书写出可被他人辨识笔迹的练习过程。在书写实践中,人们发现因书写规范制约带来的书写低效与各种书写场景对书写速度要求之间的矛盾日益突出。在书写技能的逐步形成以后,在不影响文字辨识情况下,各种连笔书写方式孕育而生。为了达到快速书写的目的,又或者为了体现与众不同,各种个性化的书写方式开始涌现,例如在提连笔方面,某些该连笔的笔画没有连笔,或者该提笔的笔画没有提笔,或者相反。这些书写方式不是书写规范所规定的,它们是否出现以及出现组合具有多种表现形式,反映书写人的书写特点,具有高度的个性化,以及不易被察觉和摹仿的特性。但笔画提连笔特征的提取并非易事。一方面,笔画提连笔特征的提取依赖对书写规范的感知,即书写规范规定在哪段笔画是应该或不应该提笔或断笔的。这个能力以笔迹分割、笔画匹配和笔画识别等一系列工作为前提。另一方面,笔画提连笔特征还需通过稳定性和特殊性的衡量才具有同一性认定的鉴定价值。除了依赖提连笔特征的有效提取,稳定性和特殊性还依赖于这些特征在人群中出现的概率分析。现有技术缺少对书写规范的感知能力,因而难以有效提取笔画提连笔特征,以及进一步分析这些特征的同一性认定价值。
技术实现思路
本专利技术的目的就是针对上述技术的不足,提供在线笔迹认证中笔画提连笔特征的提取及认证方法,能有效提取出处于局部笔画的虚提笔或连笔特征,并估算稳定且一致虚提笔和连笔笔画组合在人群中出现的概率,有助于识别出违反书写规范且稳定的书写方式,提升笔迹认证性能。为实现上述目的,本专利技术所设计的在线笔迹认证中笔画提连笔特征的提取及认证方法,包括如下步骤:A)笔画提连笔特征预学习:收集人群关于标准汉字c的手写笔迹样本取得预学习手写笔迹样本集合,识别所述预学习手写笔迹样本集合中的笔画类型,依据书写力分量是否小于一定阈值来判别在书写各段笔画时是否有或没有提笔,根据所识别的笔画类型统计各种笔画的虚提笔和连笔特征在人群中出现的次数,将所述各种笔画的虚提笔和连笔特征在人群中出现的次数与所述预学习手写笔迹样本集合中的样本个数之比作为笔画的虚提笔和连笔特征在人群中出现的概率;所述笔画提连笔包含提笔和连笔;所述笔画提笔包含虚提笔、断笔、抬笔,所述笔画连笔包含连笔、未断笔和未抬笔;所述笔画的虚提笔、断笔、抬笔是指,在书写规范规定的汉字书写过程中,在本应连笔而不应有提笔或断笔的地方,由于快速书写造成的意连笔断或虚提笔或抬笔的书写现象,或在书写笔画时由于犹豫造成的提笔停顿后重新继续书写的断笔书写现象;所述笔画的连笔、未断笔、未抬笔是指,在书写规范规定的一段笔画结束与下一段笔画开始之间本应有提笔或断笔或抬笔的地方,由于快速书写,造成未有提笔或断笔或抬笔而连续书写的现象;所述手写笔迹是指通过专用的数据传感设备实时采集书写过程中笔尖运动产生的各种信息所获得的与时间相关的时序信号序列,数据传感设备在每个采样时刻采集的数据包括笔尖的二维位置信息、笔尖施加在书定平面上的压力;所述标准汉字c的手写笔迹样本是指书写人手写的可被其他人正确辩识的或只能被少数人辩识的或只能被书写者自己辩识为标准汉字c的非标准手写体笔迹,所谓辩识是指建立手写体笔迹与标准汉字之间的对应关系;所述识别手写笔迹样本中的笔画类型是指建立手写笔迹样本中笔画与标准汉字中笔画的对应关系;所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;B)笔画提连笔特征注册:收集注册用户关于标准汉字c的若干个注册手写笔迹样本,组成注册手写笔迹样本集合,识别所述注册手写笔迹样本集合中的笔画类型,并按笔画类型统计注册手写笔迹样本集合中各笔画的虚提笔和连笔特征出现的次数,将所述注册手写笔迹样本中各笔画的虚提笔和连笔特征在所述注册手写笔迹样本集合中出现的次数与所述注册手写笔迹样本集合中的样本个数之比作为评判笔画的虚提笔和连笔特征是否稳定的依据,若某笔画的虚提笔或连笔特征在所述注册手写笔迹样本集合中出现的次数与所述注册手写笔迹样本集合中所有样本个数之比大于预先设定的阈值,则称注册用户书写该笔画的虚提笔或连笔特征为稳定的,所述阈值的设定使每个笔画类型的虚提笔和连笔特征至多只能有一个是稳定的;所述注册手写笔迹样本是指在注册阶段注册用户书写并提交的用户身份已知的手写笔迹,所述用户身份已知是指手写笔迹书写者的身份是已知的;C)笔画提连笔特征认证:待认证用户提交一个关于标准汉字c的测试手写笔迹样本,按笔画类型统计所述测试手写笔迹样本中笔画的虚提笔和连笔特征,找出与所述注册手写笔迹样本集合中虚提笔和连笔特征稳定且一致的笔画,依据在笔画提连笔特征预学习阶段计算得到的标准汉字c所有笔画的虚提笔和连笔特征在人群中出现的概率,计算观测到测试手写笔迹样本与注册手写笔迹样本集合中所有稳定且一致的虚提笔和连笔笔画组合的概率,根据所述概率,结合其它笔画特征,包括笔画布局、笔顺、书写节奏,综合判断测试手写笔迹样本是否为真实笔迹;所述稳定且一致是指测试手写笔迹样本在书写某段笔画类型的笔画时提笔或未提笔状态与所述注册手写笔迹样本集合中的笔迹样本在书写类型相同的笔画时稳定的提笔或连笔特征相同;所述稳定提笔特征是指注册手写笔迹样本集合中的笔迹样本在书写某段笔画类型的笔画时提笔的样本个数超过未提笔的样本个数;稳定连笔特征是指注册手写笔迹样本集合中的笔迹样本在书写某段笔画类型的笔画时未提笔的样本个数超过提笔的样本个数;所述测试手写笔迹样本是指在认证阶段待认证用户书写并提交的用户身份未知且有待确认的手写笔迹,所述用户身份未知是指还未确认书写手写笔迹的用户身份与模板笔迹的用户身份是否相一致,有待进一步确认;所述待认证用户是指真实身份未得到确认的用户;优选地,所述步骤A)中,笔画提连笔特征预学习包括如下步骤:A1)设S={s1,s2,...,sN}表示足够多书写者手写的关于标准汉字c的预学习手写笔迹样本集合,每位书写者提供了1至3个样本,设T={t1,t2,...,tO}表示标准汉字c包含的所有基本笔画集合,O表示标准汉字c包含的所有基本笔画数,N表示集合S中包含的笔迹个数;所述足够多是指集合S中的手写笔迹样本所包含的动态特征具有广泛的代表性,涵盖了手写汉字c各种动态特征在人群中所有可能的变化;所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;A2)初始化预学习手写笔迹样本集合S中笔画的提笔和未提笔次数向量E=(e本文档来自技高网...
【技术保护点】
1.在线笔迹认证中笔画提连笔特征的提取及认证方法,其特征在于:包括如下步骤:/nA)笔画提连笔特征预学习:收集人群关于标准汉字c的手写笔迹样本取得预学习手写笔迹样本集合,识别所述预学习手写笔迹样本集合中的笔画类型,依据书写力分量是否小于一定阈值来判别在书写各段笔画时是否有或没有提笔,根据所识别的笔画类型统计各种笔画的虚提笔和连笔特征在人群中出现的次数,将所述各种笔画的虚提笔和连笔特征在人群中出现的次数与所述预学习手写笔迹样本集合中的样本个数之比作为笔画的虚提笔和连笔特征在人群中出现的概率;/n所述笔画提连笔包含提笔和连笔;所述笔画提笔包含虚提笔、断笔、抬笔,所述笔画连笔包含连笔、未断笔和未抬笔;/n所述笔画的虚提笔、断笔、抬笔是指,在书写规范规定的汉字书写过程中,在本应连笔而不应有提笔或断笔的地方,由于快速书写造成的意连笔断或虚提笔或抬笔的书写现象,或在书写笔画时由于犹豫造成的提笔停顿后重新继续书写的断笔书写现象;/n所述笔画的连笔、未断笔、未抬笔是指,在书写规范规定的一段笔画结束与下一段笔画开始之间本应有提笔或断笔或抬笔的地方,由于快速书写,造成未有提笔或断笔或抬笔而连续书写的现象;/n所述手写笔迹是指通过专用的数据传感设备实时采集书写过程中笔尖运动产生的各种信息所获得的与时间相关的时序信号序列,数据传感设备在每个采样时刻采集的数据包括笔尖的二维位置信息、笔尖施加在书定平面上的压力;/n所述标准汉字c的手写笔迹样本是指书写人手写的可被其他人正确辩识的或只能被少数人辩识的或只能被书写者自己辩识为标准汉字c的非标准手写体笔迹,所谓辩识是指建立手写体笔迹与标准汉字之间的对应关系;/n所述识别手写笔迹样本中的笔画类型是指建立手写笔迹样本中笔画与标准汉字中笔画的对应关系;/n所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;/nB)笔画提连笔特征注册:收集注册用户关于标准汉字c的若干个注册手写笔迹样本,组成注册手写笔迹样本集合,识别所述注册手写笔迹样本集合中的笔画类型,并按笔画类型统计注册手写笔迹样本集合中各笔画的虚提笔和连笔特征出现的次数,将所述注册手写笔迹样本中各笔画的虚提笔和连笔特征在所述注册手写笔迹样本集合中出现的次数与所述注册手写笔迹样本集合中的样本个数之比作为评判笔画的虚提笔和连笔特征是否稳定的依据,若某笔画的虚提笔或连笔特征在所述注册手写笔迹样本集合中出现的次数与所述注册手写笔迹样本集合中所有样本个数之比大于预先设定的阈值,则称注册用户书写该笔画的虚提笔或连笔特征为稳定的,所述阈值的设定使每个笔画类型的虚提笔和连笔特征至多只能有一个是稳定的;/n所述注册手写笔迹样本是指在注册阶段注册用户书写并提交的用户身份已知的手写笔迹,所述用户身份已知是指手写笔迹书写者的身份是已知的;/nC)笔画提连笔特征认证:待认证用户提交一个关于标准汉字c的的测试手写笔迹样本,按笔画类型统计所述测试手写笔迹样本中笔画的虚提笔和连笔特征,找出与所述注册手写笔迹样本集合中虚提笔和连笔特征稳定且一致的笔画,依据在笔画提连笔特征预学习阶段计算得到的标准汉字c所有笔画的虚提笔和连笔特征在人群中出现的概率,计算观测到测试手写笔迹样本与注册手写笔迹样本集合中所有稳定且一致的虚提笔和连笔笔画组合的概率,根据所述概率,结合其它笔画特征,包括笔画布局、笔顺、书写节奏,综合判断测试手写笔迹样本是否为真实笔迹;/n所述稳定且一致是指测试手写笔迹样本在书写某段笔画类型的笔画时提笔或未提笔状态与所述注册手写笔迹样本集合中的笔迹样本在书写类型相同的笔画时稳定的提笔或连笔特征相同;所述稳定提笔特征是指注册手写笔迹样本集合中的笔迹样本在书写某段笔画类型的笔画时提笔的样本个数超过未提笔的样本个数;稳定连笔特征是指注册手写笔迹样本集合中的笔迹样本在书写某段笔画类型的笔画时未提笔的样本个数超过提笔的样本个数;/n所述测试手写笔迹样本是指在认证阶段待认证用户书写并提交的用户身份未知且有待确认的手写笔迹,所述用户身份未知是指还未确认书写手写笔迹的用户身份与模板笔迹的用户身份是否相一致,有待进一步确认;/n所述待认证用户是指真实身份未得到确认的用户。/n...
【技术特征摘要】
1.在线笔迹认证中笔画提连笔特征的提取及认证方法,其特征在于:包括如下步骤:
A)笔画提连笔特征预学习:收集人群关于标准汉字c的手写笔迹样本取得预学习手写笔迹样本集合,识别所述预学习手写笔迹样本集合中的笔画类型,依据书写力分量是否小于一定阈值来判别在书写各段笔画时是否有或没有提笔,根据所识别的笔画类型统计各种笔画的虚提笔和连笔特征在人群中出现的次数,将所述各种笔画的虚提笔和连笔特征在人群中出现的次数与所述预学习手写笔迹样本集合中的样本个数之比作为笔画的虚提笔和连笔特征在人群中出现的概率;
所述笔画提连笔包含提笔和连笔;所述笔画提笔包含虚提笔、断笔、抬笔,所述笔画连笔包含连笔、未断笔和未抬笔;
所述笔画的虚提笔、断笔、抬笔是指,在书写规范规定的汉字书写过程中,在本应连笔而不应有提笔或断笔的地方,由于快速书写造成的意连笔断或虚提笔或抬笔的书写现象,或在书写笔画时由于犹豫造成的提笔停顿后重新继续书写的断笔书写现象;
所述笔画的连笔、未断笔、未抬笔是指,在书写规范规定的一段笔画结束与下一段笔画开始之间本应有提笔或断笔或抬笔的地方,由于快速书写,造成未有提笔或断笔或抬笔而连续书写的现象;
所述手写笔迹是指通过专用的数据传感设备实时采集书写过程中笔尖运动产生的各种信息所获得的与时间相关的时序信号序列,数据传感设备在每个采样时刻采集的数据包括笔尖的二维位置信息、笔尖施加在书定平面上的压力;
所述标准汉字c的手写笔迹样本是指书写人手写的可被其他人正确辩识的或只能被少数人辩识的或只能被书写者自己辩识为标准汉字c的非标准手写体笔迹,所谓辩识是指建立手写体笔迹与标准汉字之间的对应关系;
所述识别手写笔迹样本中的笔画类型是指建立手写笔迹样本中笔画与标准汉字中笔画的对应关系;
所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
B)笔画提连笔特征注册:收集注册用户关于标准汉字c的若干个注册手写笔迹样本,组成注册手写笔迹样本集合,识别所述注册手写笔迹样本集合中的笔画类型,并按笔画类型统计注册手写笔迹样本集合中各笔画的虚提笔和连笔特征出现的次数,将所述注册手写笔迹样本中各笔画的虚提笔和连笔特征在所述注册手写笔迹样本集合中出现的次数与所述注册手写笔迹样本集合中的样本个数之比作为评判笔画的虚提笔和连笔特征是否稳定的依据,若某笔画的虚提笔或连笔特征在所述注册手写笔迹样本集合中出现的次数与所述注册手写笔迹样本集合中所有样本个数之比大于预先设定的阈值,则称注册用户书写该笔画的虚提笔或连笔特征为稳定的,所述阈值的设定使每个笔画类型的虚提笔和连笔特征至多只能有一个是稳定的;
所述注册手写笔迹样本是指在注册阶段注册用户书写并提交的用户身份已知的手写笔迹,所述用户身份已知是指手写笔迹书写者的身份是已知的;
C)笔画提连笔特征认证:待认证用户提交一个关于标准汉字c的的测试手写笔迹样本,按笔画类型统计所述测试手写笔迹样本中笔画的虚提笔和连笔特征,找出与所述注册手写笔迹样本集合中虚提笔和连笔特征稳定且一致的笔画,依据在笔画提连笔特征预学习阶段计算得到的标准汉字c所有笔画的虚提笔和连笔特征在人群中出现的概率,计算观测到测试手写笔迹样本与注册手写笔迹样本集合中所有稳定且一致的虚提笔和连笔笔画组合的概率,根据所述概率,结合其它笔画特征,包括笔画布局、笔顺、书写节奏,综合判断测试手写笔迹样本是否为真实笔迹;
所述稳定且一致是指测试手写笔迹样本在书写某段笔画类型的笔画时提笔或未提笔状态与所述注册手写笔迹样本集合中的笔迹样本在书写类型相同的笔画时稳定的提笔或连笔特征相同;所述稳定提笔特征是指注册手写笔迹样本集合中的笔迹样本在书写某段笔画类型的笔画时提笔的样本个数超过未提笔的样本个数;稳定连笔特征是指注册手写笔迹样本集合中的笔迹样本在书写某段笔画类型的笔画时未提笔的样本个数超过提笔的样本个数;
所述测试手写笔迹样本是指在认证阶段待认证用户书写并提交的用户身份未知且有待确认的手写笔迹,所述用户身份未知是指还未确认书写手写笔迹的用户身份与模板笔迹的用户身份是否相一致,有待进一步确认;
所述待认证用户是指真实身份未得到确认的用户。
2.根据权利要求1所述在线笔迹认证中笔画提连笔特征的提取及认证方法,其特征在于:所述步骤A)中,笔画提连笔特征预学习包括如下步骤:
A1)设S={s1,s2,...,sN}表示足够多书写者手写的关于标准汉字c的预学习手写笔迹样本集合,每位书写者提供了1至3个样本,设T={t1,t2,...,tO}表示标准汉字c包含的所有基本笔画集合,O表示标准汉字c包含的所有基本笔画数,N表示集合S中包含的笔迹个数;所述足够多是指集合S中的手写笔迹样本所包含的动态特征具有广泛的代表性,涵盖了手写汉字c各种动态特征在人群中所有可能的变化;所述标准汉字是目前已被广泛使用的具有标准书写样式和表现形式的汉字;
A2)初始化预学习手写笔迹样本集合S中笔画的提笔和未提笔次数向量E=(e1,e2,...,eO),E'=(e'1,e'2,...,e'O),设置初始值ei=0,e′i=0,1≤i≤O;
A3)初始化循环变量k=1;
A4)识别第k个手写笔迹的笔画类型,即识别手写笔迹样本中各段笔画的类型,其中符号xm,ym,fm分别表示传感器在第m时刻获取笔尖二维位置信息和笔尖的正向压力信息,1≤m≤nk,nk表示笔迹sk中采样点个数;设表示识别手写笔迹样本sk∈S中每一段笔画得到的笔画类型集合,nk表示手写笔迹样本sk∈S中包含的采样点个数,xk表示手写笔迹样本sk∈S中包含的笔画数,1≤oj≤O,1≤j≤xk,1≤k...
【专利技术属性】
技术研发人员:邹杰,徐志刚,
申请(专利权)人:湖北工业大学,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。