一种整合语音输入和手写输入功能的汉字输入系统技术方案

技术编号:2835903 阅读:696 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种整合语音输入和手写输入功能的汉字输入系统,属于汉字输入方法的应用技术领域。该系统包括手写/语音输入模块、手写/语音信号特征生成模块、手写体/语音候选汉字字列生成模块、整合模块、汉字识别及显示模块、手写/语音模型训练模块及手写/语音数据库。本发明专利技术在手写输入时辅以语音输入,可提高汉字的识别率,解决了只使用手写/语音输入存在的问题:有不会写/读的汉字而无法完成输入及对结构相似或发音相同的汉字无法识别或无法正确识别,同时,使用该系统的过程中进行手写/语音模型训练,建立个人的手写/语音数据库,在不改变用户使用习惯的同时可加速识别步骤的进行,对高重复率的汉字的识别尤其快速有效。

【技术实现步骤摘要】

本专利技术属于计算机识别
,是一种整合语音输入和手写输入功能的汉字输入系统,该系统可以提高输入汉字的识别率,帮助消费者更加方便地使用手机、电脑等输入系统进行汉字输入。
技术介绍
随着移动通信技术的迅速发展,手机、电脑用户的数量也在快速增长,应用在手机、电脑上的输入方法也越来越重要。由于手机、电脑上的按键数量有限,在有限的按键上输入信息往往费时费力,通常需不断地在屏幕选单中上下搜寻才能取得想要输入的信息,使得传统的文字的手动录入比较烦琐。且手机、电脑上的按键大小通常都比较小,许多老年人由于视力的原因看不清楚按键上的字母或者不会熟练使用拼音/笔划输入法,使得手动输入汉字相当不方便。针对以上问题,有人就提出了语音输入方法以及手写输入方法在手机以及电脑等输入系统上的应用。语音与手写输入识别的技术发展上,其相关技术已见诸于各类技术文件中,例如以语音识别而言,公开号为CN1373406A的专利文献中提出了一种语音识别汉字输入法、公开号为CN1494299A的专利文献中提出了一种手机上语音输入转换成文字的装置与方法。另一方面,手写识别则如公开号为CN1335703A的专利文献中提供了一种具有手写字符的输入、显示和传输功能的手机,或者如公开号为CN1350390A的专利文献中提出了一种手机字符手写输入的方法及相应的系统,足见语音与手写输入的识别技术皆已逐渐成熟。然而,虽然上述各专利技术皆在算法的改进、手写/语音输入的特征提取,或是改进语音或手写模型的建立准则等等方面做了很多的工作,然其识别率的提高依然有限,由于手写输入的识别技术的某些局限性,使得对于结构极其相似的汉字,如“巳”、“已”和“己”以及“日”和“曰”,甚至“四”和“皿”、“江”和“红”等均无法识别或者无法很好地识别;对于语音输入而言,这种局限性表现的更加明显,因为同一个音对应的汉字往往有很多个,那么到底是哪一个呢?上述方法同样无法解决这一问题。鉴于上述方法在识别率提高方面很有限,有人提出整合手写与语音输入信号以提高识别率的概念。其中,公开号为CN1549244A的专利文献《整合语音与手写输入的识别方法及系统》提出了一种整合语音与手写输入的识别方法,该方法是先接收一具有一字符的语音/手写输入后,识别该语音/手写输入而产生一字列,且该字列具有多个与该字符相对应的识别字符,然后接收一描绘该字符之一特征的手写/语音输入,最后依据该特征由该字符列中撷取与该字符最相符合的识别字符,因此可以有效地整合语音与手写输入,并藉此提高识别率。然而,虽然上述方法在识别率的提高上确能达到其效果,却依然存在许多待解决的问题。如(1)上述方法提出的必须区分第一输入以及第二输入,即第一输入是一语音输入与一手写输入其中之一,第二输入是该语音输入与手写输入其中另一,其识别字符的方法是,根据第一输入产生一字列,然后接收第二输入,并根据第二输入由第一输入产生的字列中撷取与第二输入最相符合的识别字符,这样存在的问题是若第一输入为手写输入时,用户碰到不会写的字时就无法完成第一输入而产生一字列;若第一输入为语音输入时,用户碰到不会读的字时也无法完成第一输入而产生一字列;这样,无法根据第一输入产生一字列,也就无法根据第二输入由第一输入产生的字列中撷取与第二输入最相符合的识别字符,从而无法达到正确输入的目的;(2)上述方法提出的手写/语音模型训练器只在训练模式下才工作,即在使用该系统之前由用户事先专门对其进行训练,这样才能达到建立个人的手写/语音模型并存储在手写/语音数据库中的目的,而在使用过程中,该手写/语音数据库是保持不变的,这种静态的训练方式比较单一,同时也不符合用户的使用习惯。
技术实现思路
本专利技术的目的在于提供一种整合语音输入和手写输入功能的汉字输入系统,该系统可以帮助消费者更加方便地使用手机、电脑等输入系统进行汉字的输入,同时较好地解决了前面提到的已有方法存在的问题。本专利技术提供的一种整合语音输入和手写输入功能的汉字输入系统,包括手写模型训练模块、手写数据库、手写输入模块、手写信号特征生成模块和手写体候选汉字字列生成模块;手写输入模块用于接收汉字的手写输入,转化为数字信号后分别传送给手写模型训练模块和手写信号特征生成模块;手写模型训练模块用于调整手写数据库中的参数,并将其存储至手写数据库;手写数据库用于存储有手写体汉字与汉字的匹配数据以及相关的匹配规则,接收并处理手写体候选汉字字列生成模块发送的请求;手写信号特征生成模块用于从数字信号中提取有效的手写信号特征,并将其送入手写体候选汉字字列生成模块;手写体候选汉字字列生成模块接收到手写信号特征生成模块生成的待识别手写体的手写信号特征后,向手写数据库发送请求,要求手写数据库提供其已存储的所有汉字的手写信号特征,接收到手写数据库提供的其已存储的所有汉字的手写信号特征后,计算待识别手写体的手写信号特征与手写数据库提供的其已存储的所有汉字的手写信号特征之间的相似度大小,产生一手写体候选汉字字列;其特征在于该系统还包括语音输入模块、语音信号特征生成模块、语音候选汉字字列生成模块、语音数据库、语音模型训练模块、整合模块和汉字识别及显示模块;语音输入模块用于接收最多一个汉字的语音输入,并将该语音输入装置的输出转化为数字信号,分别传送给语音信号特征生成模块和语音模型训练模块;语音信号特征生成模块用于提取有效的语音信号特征,并发送至语音候选汉字字列生成模块;语音候选汉字字列生成模块接收到语音信号特征生成模块生成的待识别语音的语音信号特征后,向语音数据库发送请求,接收其反馈的语音信号特征后,计算待识别语音的语音信号特征与语音数据库提供的其已存储的所有汉字的语音信号特征之间的相似度大小,用于产生一语音候选汉字字列,传送至整合模块;语音数据库用于存储有语音与汉字的匹配数据以及相关的匹配规则等,用于接收并处理语音候选汉字字列生成模块发送的请求;语音模型训练模块用于调整语音数据库中的参数,并存储至语音数据库;整合模块接收手写体候选汉字字列生成模块和语音候选汉字字列生成模块发送来的手写体候选汉字字列和语音候选汉字字列,对二者进行组合,产生整体候选汉字字列,将其传送给汉字识别及显示模块;汉字识别及显示模块用于从整合模块产生的整体候选汉字字列中选择权重最大的汉字,并将该汉字显示,若整体候选汉字字列为空,则提示重新输入。本专利技术系统使用时,接收一个汉字的手写输入的同时辅以语音输入,在提高了汉字识别率的同时,解决了上述的由于先根据第一输入信号显示一频率最高的汉字,再输入第二信号用于修正而带来的麻烦,也解决了手写输入作为第一输入时汉字不会写或者语音输入作为第一输入时拼音拼不准而无法完成输入的问题以及单独的只使用手写输入或者语音输入时,对结构相似或者发音相同的汉字无法识别或无法正确识别的问题;同时,利用手写/语音模型训练模块,在个人使用该输入系统的过程中,建立个人的手写/语音模型,并储存在手写/语音数据库中,加速了识别步骤的进行、提高了识别率,而其在使用的过程中动态更新手写/语音数据库,不必人为事先专门对其进行训练,符合人们的使用习惯,对于高重复率的汉字的识别尤其快速有效。附图说明图1为本专利技术系统的结构示意图;图2为本专利技术汉字识别及显示模块按照手写体候选汉字字列和语音候选汉字本文档来自技高网
...

【技术保护点】
一种整合语音输入和手写输入功能的汉字输入系统,包括手写模型训练模块(1)、手写数据库(2)、手写输入模块(3)、手写信号特征生成模块(4)和手写体候选汉字字列生成模块(5);手写输入模块(3)用于接收汉字的手写输入,转化为数字信号后 分别传送给手写模型训练模块(1)和手写信号特征生成模块(4);手写模型训练模块(1)用于调整手写数据库(2)中的参数,并将其存储至手写数据库(2);手写数据库(2)用于存储有手写体汉字与汉字的匹配数据以及相关的匹配规则,接收 并处理手写体候选汉字字列生成模块(5)发送的请求;手写信号特征生成模块(4)用于从数字信号中提取有效的手写信号特征,并将其送入手写体候选汉字字列生成模块(5);手写体候选汉字字列生成模块(5)接收到手写信号特征生成模块(4) 生成的待识别手写体的手写信号特征后,向手写数据库(2)发送请求,要求手写数据库(2)提供其已存储的所有汉字的手写信号特征,接收到手写数据库(2)提供的其已存储的所有汉字的手写信号特征后,计算待识别手写体的手写信号特征与手写数据库(2)提供的其已存储的所有汉字的手写信号特征之间的相似度大小,产生一手写体候选汉字字列;其特征在于:该系统还包括语音输入模块(8)、语音信号特征生成模块(9)、语音候选汉字字列生成模块(10)、语音数据库(11)、语音模型训练模块(12)、整合 模块(6)和汉字识别及显示模块(7);语音输入模块(8)用于接收最多一个汉字的语音输入,并将该语音输入装置的输出转化为数字信号,分别传送给语音信号特征生成模块(9)和语音模型训练模块(12);语音信号特征生成模块(9)用于提 取有效的语音信号特征,并发送至语音候选汉字字列生成模块(10);语音候选汉字字列生成模块(10)接收到语音信号特征生成模块(9)生成的待识别语音的语音信号特征后,向语音数据库(11)发送请求,接收其反馈的语音信号特征后,计算待识别语 音的语音信号特征与语音数据库(11)提供的其已存储的所有汉字的语音信号特征之间的相似度大小,用于产生一语音候选汉字字列,传送至整合模块(6);语音数据库(11)用于存储有语音与汉字的匹配数据以及相关的匹配规则等,用于接收并处理语音候 选汉字字列生成模块(10)发送的请求;语音模型训练模块(12)用于调整语音数据库(11)中的参数,并存储至语音数据库(11);...

【技术特征摘要】

【专利技术属性】
技术研发人员:刘宏宋恩民吕新桥代四广
申请(专利权)人:华中科技大学
类型:发明
国别省市:83[中国|武汉]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利