信息处理装置和字符识别方法制造方法及图纸

技术编号:10698223 阅读:394 留言:0更新日期:2014-11-27 03:00
一种字符识别方法和信息处理装置,该信息处理装置包括:存储单元,其被配置成存储其中字符的字符代码和图像数据彼此相关联的第一信息;以及操作单元。操作单元被配置成:检测指示通过手写输入而输入的多个字符中的每个字符的输入位置的第二信息,并且检测与所述多个字符相关联的多个字符代码;通过参考第一信息来获取与所述多个字符代码相关联的多个第一图像数据;通过基于第二信息对所述多个第一图像数据进行组合来生成第二图像数据;以及通过参考第一信息来输出与所述第二图像数据相关联的字符的图像数据或者与该第二图像数据相关联的字符代码。

【技术实现步骤摘要】
信息处理装置和字符识别方法
本文所讨论的实施方式涉及一种信息处理装置、一种字符识别方法以及一种其中存储有字符识别程序的存储介质。
技术介绍
所谓的字符识别技术已投入使用。执行字符识别的装置接收由用户使用输入设备(例如触摸面板或鼠标)输入的字符的手写输入,并估计用户打算输入的字符的字符代码。当针对该字符代码存在多个候选项时,装置可以提示用户选择所述候选项中之一。字符识别技术中的问题之一在于需要提高字符的识别准确度。例如,存在如下一种建议的方法:其中,在字符的输入区域中形成多个输入框,并将通过划分单个汉字而获得的多个部件(例如,編、旁、冠)输入到每个输入框。在所建议的技术中,将部件集与字符的对应关系预先存储在存储模块中,以对在每个输入框中输入的部件集与存储在存储模块中的部件集进行比较,从而在显示装置中显示包含在该框中输入的部件集的字符。另外,存在如下另一种建议的方法:其中,结合针对每一个笔画先前输入的笔画数据来生成手写输入的笔画数据,针对每一个笔画先前输入的笔画数据指示在手写于手写中输入的字符时单次移动形成的线;并将该笔画数据与由预先准备的笔画数据组成的字典字符数据进行比较,以执行字符识别,同时确定手写输入的笔画数据与字典字符数据之间的相似度。当手写输入的笔画数据与字典字符数据的相似度变为零时,将通过之前的一个笔画的手写输入所生成的、手写输入的笔画数据分割为单个字符,并将包含手写输入的笔画数据的字典字符数据显示为候选字符。例如,参见日本特开平H7-121660号公报和日本特开平H11-134437号公报。在上述方法中,针对待识别的每个目标字符,预先准备用于与部件集或笔画数据进行比对的字典数据。然而,字符的数目庞大,因此不容易将所有字符采集到字典数据中。例如,字典数据的准备工作需要例如从多个用户提取成为每个字符的样本的多个笔画信息以及将该笔画信息登记在字典数据中的时间。因此,一些字符可能未被登记在字典数据中。例如,具有低使用频率的一些字符(如异体字或外来字)可能未被登记在字典数据中。因此,如何高准确度地识别未登记在字典数据中的字符成为问题。本公开内容的一个方面旨在提供能够高准确度地识别未登记在字典数据中的字符的程序、信息处理装置和字符识别方法。
技术实现思路
根据实施方式的一个方面,信息处理装置包括:存储单元,其被配置成存储其中字符的字符代码和图像数据彼此相关联的第一信息;以及操作单元。操作单元被配置成:检测指示通过手写输入而输入的多个字符中的每个字符的输入位置的第二信息,并且检测与所述多个字符相关联的多个字符代码;通过参考第一信息来获取与所述多个字符代码相关联的多个第一图像数据;通过基于第二信息对所述多个第一图像数据进行组合来生成第二图像数据;以及通过参考第一信息来输出与所述第二图像数据相关联的字符的图像数据或者与该第二图像数据相关联的字符代码。本公开内容的目的和优点将借助于权利要求中特别指出的元素和组合来实现和获取。要理解的是,以上的一般描述和以下的详细描述二者均为示例性和说明性的,并非如权利要求主张的那样限制本专利技术。根据本公开内容的一个方面,可以高准确度地识别未登记在字典数据中的字符。附图说明图1是示出第一实施方式的信息处理装置的视图;图2是示出第二实施方式的客户端设备的视图;图3是示出客户端设备的硬件的示例的视图;图4是示出客户端设备的功能的示例的视图;图5是示出字符形状表的示例的视图;图6是示出字典表的示例的视图;图7是示出输入历史表的示例的视图;图8是示出相似度历史表的示例的视图;图9是示出组合表的示例的视图;图10是示出字符识别过程的示例的流程图;图11是示出字符识别过程的(延续的)示例的流程图;图12A至图12C是示出部件字符确定的具体示例的视图;图13A至图13D是示出部件字符确定的(延续的)具体示例的视图;图14是示出经变形的图像数据的示例的视图;图15A至图15C是示出经变形的图像数据的合成的示例的视图;以及图16是示出最终结果的输出的示例的视图。具体实施方式[第一实施方式]在下文中,将参照附图详细地描述本公开内容中公开的显示控制装置、系统和显示控制程序的示例性实施方式。此外,实施方式并非旨在限制所公开的技术。图1是示出第一实施方式的信息处理装置的视图。第一信息处理装置1对由用户手写输入的字符执行字符识别。例如,通过使用设置在第一信息处理装置中的输入设备,如触摸面板、触摸板或鼠标,用户可以对该第一信息处理装置执行手写输入。输入设备可以是第一信息处理装置的外部连接设备。此处,可以将针对手写输入的字符在手写中的单次移动形成的线条称为笔画。另外,可以将包含形成单个字符的笔画集或书写顺序(笔画的顺序)的信息称为笔画信息。第一信息处理装置包括存储单元1a和操作单元1b。存储单元1a可以为:非易失性存储设备,例如随机存取存储器(RAM);或者易失性存储设备,例如硬盘驱动器(HDD)或闪速存储器。操作单元1b可以包括例如中央处理单元(CPU)、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)。操作单元1b可以为执行程序的处理器。还可以包括多个处理器集(多处理器)作为“处理器”。存储单元1a存储其中字符的字符代码和图像数据彼此相关联的字符形状数据2。例如,字符形状数据2包括:例如,字符代码A1与图像数据X1(其指示字符“火”)之间的关联关系;字符代码A2与图像数据X2(其指示字符“ク”)之间的关联;字符代码A3与图像数据X3(其表示字符“臼”)之间的关联;以及字符代码A4与图像数据X4(其指示字符的异体字“焔”)之间的关联。此外,存储单元1a存储其中字符代码和参考笔画信息彼此相关联的字典数据3。例如,字典数据3包括:字符代码A1与笔画信息Px之间的关联;字符代码A2与笔画信息Py之间的关联;以及字符代码A3与笔画信息Pz之间的关联。此处,关于字符代码A4的笔画信息未登记在字典数据3中。操作单元1b检测如下位置信息:该位置信息指示由用户通过手写输入而输入的多个字符的输入位置。例如,操作单元1b基于手写输入的笔画信息和存储在存储单元1a中的字典数据3来检测与多个输入字符相关联的多个字符代码。例如,操作单元1b接收通过手写输入的输入数据4。输入数据4包括字符4a、4b和4c。字符4a、4b和4c中的每个字符是由通过用户输入的多个笔画形成的。操作单元1b检测字符4a、4b和4c以及指示字符4a、4b和4c中的每个字符的输入位置的位置信息。操作单元1b可以将字符4a、4b和4c中的每个字符的笔画信息与登记在字典数据3中的笔画信息Px、Py和Pz中的每个笔画信息进行比对,以检测与字符4a、4b和4c相关联的字符代码A1、A2和A3。另外,操作单元1b可以从字符形状数据2中指定与字符4a、4b和4c相关联的图像数据,以获取用于字符4a、4b和4c的字符代码A1、A2和A3。另外,操作单元1b可以将从字符形状数据2和字典数据3获取的相应字符代码的候选项合并,以检测与字符4a、4b和4c相关联的字符代码A1、A2和A3。例如,对于字符4a,可以从字符形状数据2检测到多个字符代码的候选项,并且因此,可以从字典数据3检测到多个字符代码的候选项。在这种情况下,可以将通过字符形状数据2本文档来自技高网
...
信息处理装置和字符识别方法

【技术保护点】
一种字符识别方法,所述字符识别方法包括:检测指示通过手写输入而输入的多个字符中的每个字符的输入位置的第一信息,并且检测与所述多个字符相关联的多个字符代码;通过参考第二信息来获取与所述多个字符代码中的每个字符代码相关联的多个第一图像数据,在所述第二信息中所述字符的字符代码与图像数据彼此相关联;通过基于所述第一信息对所述多个第一图像数据进行组合来生成第二图像数据;以及通过参考所述第二信息来输出与所述第二图像数据相关联的字符的图像数据或与所述第二图像数据相关联的字符代码。

【技术特征摘要】
2013.05.16 JP 2013-1041341.一种字符识别方法,所述字符识别方法包括:检测指示通过手写输入而输入的多个字符中的每个字符的输入位置的第一信息,并且检测与所述多个字符相关联的多个字符代码;通过参考第二信息来获取与所述多个字符代码中的每个字符代码相关联的多个第一图像数据,在所述第二信息中所述字符的字符代码与图像数据彼此相关联;通过基于所述第一信息对所述多个第一图像数据进行组合来生成第二图像数据;以及通过参考所述第二信息来输出与所述第二图像数据相关联的字符的图像数据或与所述第二图像数据相关联的字符代码,其中,所述生成包括:基于所述第一信息对所述多个第一图像数据进行变形;以及通过对在所述变形处变形的所述多个第一图像数据进行组合来生成所述第二图像数据,其中,所述变形包括:基于所述第一信息来指定指示所述多个字符被输入的区域的多个矩形;以及使在所述变形处变形的所述多个第一图像数据中的每个第一图像数据的纵横比与所述多个矩形中的每个矩形的纵横比相匹配。2.根据权利要求1所述的字符识别方法,其中,所述变形包括:使所述多个第一图像数据中的每个第一图像数据的面积比与所述多个矩形中的每个矩形的面积比相匹配。3.根据权利要求1所述的字符识别方法,其中,所述生成包括:基于所述第一信息来指定所述多个字符的输入位置之间的相对位置关系;以及保持所述相对位置关系以组合所述多个第一图像数据。4.根据权利要求1所述的字符识别方法,其中,所述检测包括:每当接收到手写的一个笔画时,每次通过参考字典数据来将指示包含在所述字典数据中的参考笔画的信息与输入笔画中的没有被决定为用于形成字符的笔画集进行比对,在所述字典数据中登记有字符代码与指示参考笔画的信息之间的多个关联;以及基于比对结果来依次检测所述多个字符代码中的每个字符代码。5.根据权利要求4所述的字符识别...

【专利技术属性】
技术研发人员:高杉绫星哲郎
申请(专利权)人:富士通株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1