一种基于加权增量二次鉴别函数的书写者自适应方法技术

技术编号:7016908 阅读:285 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种基于加权增量二次鉴别函数(WIMQDF)的书写者自适应方法,利用具有特定用户书写风格的增量样本动态更新二次鉴别函数(MQDF)识别模型,使更新后的MQDF识别模型能适应特定用户的书写风格,从而达到提高该特定用户识别率的效果。本发明专利技术创新性的将一种加权的增量学习机制与汉字识别中的MQDF分类算法结合在一起提出了一种加权增量二次鉴别函数(WIMQDF)算法,并把WIMQDF应用于基于手写汉字识别的书写者自适应领域,解决了手写汉字识别引擎对特定用户识别率不高的问题。利用本发明专利技术提供的方法,手写汉字识别引擎能自适应特定用户的手写风格,提高识别准确度。

【技术实现步骤摘要】

本专利技术属于利用计算机处理设备识别手写文字图像的
,特别是涉及。
技术介绍
手写汉字识别一般是指用户通过手写输入设备(比如手写板、触摸屏、鼠标等)书写汉字,同时计算机将手写输入设备采集到的汉字书写轨迹转换为相应的汉字机器内码的识别技术。传统的手写识别技术通常所采用的输入方式为单字符识别,即书写一个汉字识别一个汉字。使用的识别引擎与用户无关,即识别引擎事先通过大量的训练样本训练出来, 对于不同用户,识别引擎使用的模型及参数都是一样的,事先由开发人员训练并设置好。由于采用了大数据量的训练样本,所以识别引擎能满足书写规范的用户的识别准确率要求。 但是不同用户的书写风格差异很大,每个用户书写风格除了存在共性外,往往还包括自己个性化的地方,与用户无关的识别引擎针对这类用户时书写汉字时,识别准确率往往不尽人意,有待改进。
技术实现思路
本专利技术的目的在于克服传统的识别引擎无法适应特定用户的书写风格的不足,提供一种让识别引擎能动态适应特定用户书写风格从而提高识别率的方法。本专利技术采用的技术方案为,其步骤如下(1)、选取特定用户少量的增量样本;(2)、对增量样本提取特征,并根据原始线性鉴别本文档来自技高网...

【技术保护点】
1.一种基于加权增量二次鉴别函数的书写者自适应方法,其特征在于包括如下步骤:(1)、选取用于更新模板及识别引擎的特定用户的增量样本;(2)、对增量样本提取特征,并根据原始线性鉴别分析模型对增量样本特征进行线性鉴别分析变换;(3)、利用增量样本并结合加权的增量二次鉴别函数算法,动态更新每个类别的基于加权的均值向量和协方差矩阵;(4)、采用更新后的每个类别的基于加权的均值向量和协方差矩阵,更新改进的二次鉴别函数分类器。

【技术特征摘要】
1.一种基于加权增量二次鉴别函数的书写者自适应方法,其特征在于包括如下步骤(1)、选取用于更新模板及识别引擎的特定用户的增量样本;(2)、对增量样本提取特征,并根据原始线性鉴别分析模型对增量样本特征进行线性鉴别分析变换;(3)、利用增量样本并结合加权的增量二次鉴别函数算法,动态更新每个类别的基于加权的均值向量和协方差矩阵;(4)、采用更新后的每个类别的基于加权的均值向量和协方差矩阵,更新改进的二次鉴别函数分类器。2.根据权利要求1所述的基于加权增量二次鉴别函数的书写者自适应方法,其特征在于所述步骤(1)的具体操作如下设定原始样本为I 二 (i=l,…,对,#为样本数,并设其类别数是#;设增量样本为/ 二 {yj 二人…,Z入Z为增量样本数,并设其类别数是Λ则合并后的总的样本表示为Z=X U Y = {zj (k=l, L+N),样本总数为L+N,类别总数为C,且C彡IX彡Λ对于合并后的总样本中的第i (i=l,...,C)类,分别在原始样本#和增量样本Z中有巧和人.个样本,合并后新的样本,属于第i (i=l,…,C)类的样本数为尸/。3.根据权利要求2所述的基于加权增量二次鉴别函数的书写者自适应方法,其特征在于所述步骤(2)具体更新步骤如下(...

【专利技术属性】
技术研发人员:金连文刘岗丁凯
申请(专利权)人:华南理工大学
类型:发明
国别省市:81

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1