联机文字识别装置及方法制造方法及图纸

技术编号:2934839 阅读:121 留言:0更新日期:2012-04-11 18:40
连续书写文字也能自动识别文字串。笔迹信息取得单元202以1笔划为单位把笔划取入缓冲存储器208。识别候补文字串生成单元203生成识别候补文字串存储在缓冲存储器209中。文字相似度计算单元204对于每一识别候补文字串生成组合了文字构造词典211和文字间构造词典212的文字串构造词典并和输入笔划串核对。输入文字串判定单元205把从开头开始的文字串提取结果共同的文字串部分判定为识别确定文字串并显示在显示器213上。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及从通过坐标输入装置被手写输入的文字串笔迹(笔划串)信息中随时自动提取文字加以识别并显示结果的联机文字识别装置,特别涉及最适合于文字连续书写输入的联机文字识别装置及方法及计算机可以读取的存储介质以及联机文字识别程序。
技术介绍
以往,在从经由坐标输入板等的坐标输入装置手写输入的文字串笔迹信息中,自动地提取文字进行识别,并显示结果的联机文字识别装置中,一般适用以下4种识别技术(识别方法),即(1)准备多个文字框,通过在1个文字框中顺序写入1个字,提取文字进行识别的技术;(2)从坐标输入板上检测到笔已离开一定时间,判定为文字书写结束,提取文字进行识别的技术;(3)通过用识别执行按钮等明确指示1个文字书写结束由此提取文字进行识别的技术;(4)用特殊的一笔写法定义1个文字,在输入笔划并检测到笔已离开书写板时判定为1个文字输入,提取文字进行识别的技术。
技术实现思路
但是,上述以往的识别技术,例如在(1)中,由于用户在文字书写时必须注意文字框的大小和位置,因而存在不能自然输入的问题。另外,在考虑到安装在小型信息机上的情况下,因为不能确保充分大的文字书写区域,所以如果准备多个文字框,则每个文字书写区域的面积减小,对用户来说存在难以书写的问题。另一方面,在以往的识别技术(2)、(3)中,因为不需要准备多个文字框,所以每个文字可以获得大的书写区域,可以避免(1)的问题。但是,在(2)中,在连续输入多个文字时,在每书写1个文字时,笔必须离开书写板一定时间。另外,在(3)中,每输入1个文字按压一下识别执行按钮这种文字记录,在每输入1个文字时需要进行和书写没有关系的操作。因此,(2)、(3)的识别技术存在文字串的平滑输入困难的问题。另外,在以往的识别技术(4)中,虽然可以避免上述(1)、(2)、(3)中的问题,但对用户来说必须预先记住各文字的一笔书写法。因此,特别是在成为识别对象的文字存在很多的情况下,对用户来说是非常痛苦的事。本专利技术就是考虑到上述问题而提出的,其目的在于设置成即使用户不注意文字划分,只连续书写文字时,也可以自动地识别文字串。本专利技术的另一目的在于,可以进行文字的重叠书写输入。本专利技术,是在坐标输入装置上从笔接触该坐标输入装置到离开期间,以用该坐标输入装置检测出的笔尖的坐标序列表示的笔划的串为基础进行文字识别,并在显示装置上显示识别结果的联机文字识别装置,其特征在于在每次检测出上述笔划时,对于此前被检测出的笔划的形状以及连续书写的各2个文字的组合,根据该2个文字间的笔划的位置关系求最适宜的文字串,把该文字串显示在上述显示装置上。如果采用本专利技术,则即使用户不注意文字的划分,在坐标输入装置上连续写入文字时,也可以判定并显示最相似的文字串(识别确定文字串)。在此,因为还考虑了构成文字间的各文字的笔划位置关系,所以可以进行文字的重叠书写输入。因而,即使在只准备了小书写区域的小型信息及机器中,也可以提供舒适的手写输入单元。另外,本专利技术,是在坐标输入装置上从笔接触该坐标输入装置到离开期间,以用该坐标输入装置检测出的笔尖的坐标序列表示的笔划的串为基础进行文字识别,并在显示装置上显示识别结果的联机文字识别装置,其特征在于上述坐标输入装置,具有用于用上述笔书写文字的1个文字份的书写区域,在每次检测到在上述书写区域上书写的上述笔划时,对此前检测到的笔划的形状以及重叠书写的各2个文字的组合,根据该2个文字间的笔划的位置关系求最适宜的文字串,把该文字串显示在上述显示装置上。如果采用本专利技术,则即使在用户不注意文字的划分,在坐标输入装置上重叠写入文字时,也可以判定并显示最相似的文字串(识别确定文字串)。因为也还考虑到构成文字间的各文字的笔划位置关系,所以可以进行文字的重叠写入。因而,即使在只能准备小的书写空间的小型信息机中,也可以提供舒适的手写文字输入单元。本专利技术的联机文字识别装置,其特征在于具备文字构造词典,它对于许多可以识别的文字的各自,记录有构成该文字的笔划的形状信息,以及记述笔划间的构造关系的词典信息;文字间构造词典,对于上述多个可以识别的文字中连续书写的各2个文字的组合,记录有记述了该2个文字间的构造关系的词典信息;笔迹信息取得单元,在坐标输入装置上逐次取得从笔接触该坐标输入装置到离开期间,用由该坐标输入装置检测出的笔尖的坐标序列表示的笔划;识别候补文字串生成单元,在用该笔迹信息取得单元每次取入笔迹时,对于包含该笔划的需要识别的已取得的笔划串生成可以成为识别候补的识别候补文字串;核对单元(文字串相似计算单元),它对该被生成的每一识别候补文字串,根据构成该识别候补文字串的各候补文字在上述文字构成词典中的词典信息和连续的2个文字候补之间在上述文字间构造词典中的词典信息,制作与该识别候补文字串对应的文字串构造词典,把已获得的笔划串分别和该每一识别候补文字串的文字串构造词典核对,进行确定该笔划串中的哪些笔划构成哪个候补文字的文字提取;输入文字串判定单元,对上述各识别候补文字串把从开头的上述文字提取的结果相同的文字串部分作为识别确定文字串判定并输出;识别结果显示单元,显示该被判定出的识别确定文字串。在这种构成中,因为,在每次输入笔划(笔迹)时,对于把该笔划作为最后的笔划的识别对象笔划串的每一识别候补文字串,生成组合了文字构造词典中对应的词典信息和文字间构造词典中对应的词典信息的文字串构造词典,并把该每一识别候补文字串的文字串构造词典分别和识别对象笔划串(输入笔迹)核对,所以,即使在用户不注意文字的划分,在坐标输入装置上连续写入文字时,也可以判定并显示最相似的输入文字串(识别确定文字串)。在此,因为还考虑到文字间的构造关系,所以通过准备以文字的重叠书写为前提的文字间构造词典,也可以进行文字的重叠写入。因而,即使在只能准备小的书写空间的小型信息机等中,也可以提供舒适的手写文字输入单元。在此,如果在设置用于储存由笔迹信息取得单元取得的笔划(输入笔划)的笔划缓冲存储器,和用于存储由识别候补文字串生成单元生成的识别候补文字串的识别候补缓冲存储器的同时,设置成把采用核对单元的笔划串(输入笔划串)和各识别候补文字串的文字串构造词典的核对结果,与该识别候补文字串对应地存储在识别候补缓冲存储器内,则可以在联机文字识别装置中进行高效率地处理。另外,在用笔迹信息取得单元在笔划缓冲存储器中存储输入笔划时,在笔迹信息取得单元中抽出该笔划的特征(例如形状特征),以及该笔划和前面的笔划之间的特征(例如构造特征),在该识别候补文字串生成单元中,最好根据在笔迹信息取得单元中抽出的构成该笔划串的各笔划的特征以及各笔划间的特征,生成相对笔划缓冲存储器内的笔划串的识别候补文字串。另外,在在上述核对单元内的核对处理中,在设置成把输入笔划串作为识别候补文字串计算笔迹的相似程度(表示相似程度的例如相似度)的同时,输入文字串判定单元由下述的2个单元,即,判定上述识别确定文字串并输出的识别确定文字串判定单元,和判定识别未确定文字串以及识别未确定笔划串信息并输出的识别未确定文字串以及识别未确定笔划串信息判定单元构成,进一步在识别结果显示单元中,最好设置成在显示从识别确定文字串判定单元输出的识别确定文字串的同时,显示从识别未确定文字串以及识别未确定笔划串信息判定单元输出本文档来自技高网...

【技术保护点】
一种联机文字识别装置,以在坐标输入装置上从笔接触该坐标输入装置到离开期间由该坐标输入装置检测出的笔尖的坐标序列表示的笔划串为基础进行文字识别,并在显示装置上显示识别结果,其特征在于: 在每次检测出上述笔划时,对于此前被检测出的笔划的形状以及连续书写的各2个文字的组合,根据该2个文字间的笔划的位置关系求最适宜的文字串,把该文字串显示在上述显示装置上。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:河村聪典登内洋次郎
申请(专利权)人:株式会社东芝
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利