利用预过滤器分类来提高手写识别制造技术

技术编号:17816512 阅读:39 留言:0更新日期:2018-04-28 07:44
用于改进手写检测的方法、系统和设备,包括编码在计算机存储介质上的计算机程序。在一个方面中,方法包括:接收指示一个或多个笔画的数据;确定一个或多个笔画的一个或多个特征;至少基于所述特征中的一个或多个来确定一个或多个笔画是否可能表示字素;从以下之中选择用于处理数据的特定识别过程:(i)多语言识别过程,其利用多个识别器处理输入笔画,多个识别器各自被训练为针对给定的一组输入笔画来输出与特定语言相关联的一个或多个字素,和(ii)单字符通用识别过程,其利用通用识别器处理输入笔画,通用识别器被训练为针对给定的一组输入笔画来输出单个字素;以及将数据提供给特定识别过程。

【技术实现步骤摘要】
【国外来华专利技术】利用预过滤器分类来提高手写识别
本说明书涉及手写识别。
技术介绍
用户经常提供手写输入,例如通过画符号、涂鸦(doodle)或涂写(scribble),来试验手写识别(HR)系统的识别能力。当用户提供手写输入时,HR系统尝试将输入的笔画解释为有效序列的字符。
技术实现思路
当给HR系统的手写输入包括不同类型的符号时,因为缺乏对各种杂项符号的支持,或者因为要求以快速和资源有效的方式执行HR的约束,HR系统经常展现出弱识别能力。当输入不同类型的符号时,HR系统可能输出无意义的识别结果,其对于利用手写输入作为将文本输入电子设备内的方法的用户来说,经常具有小的价值。此外,当对作为手写输入内包括的表示涂写的图案的输入笔画执行识别过程时,因为输入可能包括大量笔画,并且因为笔画的排列可能不容易与所识别的符号对应,处理可能是计算昂贵的。因此,本说明书中描述的主题的一个创新方面能够体现在以下方法中:利用多语言识别系统来初始将不同类型的手写输入分类,并然后利用在产生识别结果中更有效的特定识别过程来处理不同类型的手写输入。例如,可以分析输入笔画的特征来确定笔画是否表示字素(grapheme),字素表示在描述语言的书写系统中使用的最小单位,或者笔画是否表示涂写,涂写是手写笔画或点的随机连接(concatenation)。然后可以基于笔画表示字素还是涂写,利用不同的识别过程来处理输入。虽然本说明书总的描述包括确定输入笔画是否表示字素的特定实施,但是在其它实施中,方法可以包括确定输入笔画是否表示其它打字特征,例如字形(glyph)、异体(allograph)、字符、符号或绘图。手写输入分类和过滤可用于改善HR系统的总体识别性能,以改善用户体验。例如,通过利用适于不同类型的手写输入、例如不同语言的特定识别过程,可以减少生成识别结果的时间。在其它示例中,识别结果生成可以使用较少的计算资源,并且可以提供更准确的识别结果。更特别地,手写输入分类和过滤也可以用于处理通常与文本输入相比更难以识别的特殊手写输入,例如绘图和符号。实施可以包括一个或多个以下特征。例如,计算机实施的方法可以包括:接收指示一个或多个笔画的数据;确定一个或多个笔画的一个或多个特征;至少基于特征中的一个或多个来确定一个或多个笔画是否可能表示字素;从至少以下之中选择用于处理数据的特定识别过程:(i)多语言识别过程,多语言识别过程利用多个识别器处理输入笔画,多个识别器各自被训练为针对给定的一组输入笔画来输出与特定语言相关联的一个或多个字素,和(ii)单字符通用识别过程,单字符通用识别过程利用通用识别器处理输入笔画,通用识别器被训练为针对给定的一组输入笔画来输出单个字素;以及提供数据以利用特定识别过程处理。在其它实施中,计算机实施的方法可以包括:接收指示一个或多个笔画的数据;确定一个或多个笔画的一个或多个特征;至少基于特征中的一个或多个来确定一个或多个笔画是否可能表示字素;从至少以下之中选择用于处理数据的特定识别过程:(i)单语言识别过程,单语言识别过程利用单个识别器处理输入笔画,单个识别器被训练为针对给定的一组输入笔画来输出与特定语言相关联的一个或多个字素,和(ii)单字符通用识别过程,单字符通用识别过程利用通用识别器处理输入笔画,通用识别器被训练为针对给定的一组输入笔画来输出单个字素;以及提供数据以利用特定识别过程处理。所述方法可以进一步包括利用所选择的识别过程来处理数据的步骤,从而输出与一个或多个笔画对应的一个或多个字符的有效序列。其它版本包括对应的系统、和计算机程序,其被配置为执行在计算机存储设备上编码的方法的动作。一个或多个实施可以包括以下可选特征。例如,在一些实施中,确定一个或多个笔画是否可能表示字素包括确定一个或多个笔画可能表示字素,并且其中选择用于处理数据的特定识别过程包括选择多语言识别过程。在一些实施中,确定一个或多个笔画是否可能表示字素包括确定一个或多个笔画不可能表示字素,并且其中选择用于处理数据的特定识别过程包括选择单字符通用识别过程。在一些实施中,所述方法可以包括,其中多语言识别过程利用通用识别器进一步处理输入笔画,通用识别器被训练为针对给定的一组输入笔画,输出单个字素。在一些实施中,确定一个或多个笔画是否可能表示字素包括生成表示一个或多个笔画表示字素的可能性的置信度得分,并且其中至少基于所生成的置信度得分来选择特定识别过程。在一些实施中,选择用于处理数据的特定识别过程包括选择多个识别器的子集来输出指示一个或多个笔画的数据。在一些实施中,确定一个或多个笔画是否可能表示字素包括确定一个或多个笔画是否表示涂写或乱涂(scratch)。一种或多种实施的细节在下面的附图和描述中阐述。从描述、附图和权利要求书中,其它潜在的特征和优点将变得显而易见。这些方面的其它实施包括对应的系统、装置和计算机程序,其被配置为执行在计算机存储设备上编码的方法的动作。附图说明图1是示出用于改善手写识别的示例系统的图。图2示出了用于处理指示一个或多个笔画(stroke)的一个或多个数据的示例过程。图3是计算设备的框图,在计算设备上可以实施在本文中描述的过程、或其部分。在附图中,相同的附图标记表示在各处对应的部分。具体实施方式在本说明书中描述的主题的一个创新方面能够体现在以下的过程中:分类和过滤不同类型的手写输入和利用更有效地处理那些单独类型的输入的相应识别过程来处理所述不同类型的手写输入。图1是示出用于改善手写识别的示例系统100的图。简要地,系统100可以接收输入102,例如输入102a和102b,并且提供输出108,例如输出108a和108b,输出108是输入102的手写识别结果。在一些情况下,系统100可以计算输入置信度得分103、转录(transcript)104和转录置信度得分106。系统100也可以包括部件诸如非文本输入分类器120、识别引擎选择器130、针对语言140a-140c的多语言识别器140、单字符通用识别器150、语言选择器160、输出选择器170。另外,图1表示手写输入分类和过滤的示例。例如,示例用户101a-101b分别在输入设备屏幕110a和110b上提供输入102a和102b。输出108a和108b分别显示在输出设备屏幕180a和180b上,输出108a和108b是分别与输入102a和102b对应的识别结果。非文本输入分类器120可以是HR系统内接收手写输入例如输入102的软件模块。非文本输入分类器120可以通过初始预处理输入数据并去除可能负面影响手写识别的不相关的数据例如信号噪声、无关(extraneous)笔画,来分类作为在所接收的输入102中包括的输入笔画的集合的墨水。在一些情况下,非文本输入分类器120也可以执行额外的预处理步骤,例如正规化、采样、平滑和去噪,以改善HR系统速度和准确度。非文本输入分类器120然后可以从输入102提取特征。例如,非文本输入分类器120可以生成维度向量场以提取关于输入102的信息。例如,所提取的特征可以包括纵横比、水平半点以上的像素的百分比、垂直半点右侧的像素的百分比、笔画的数目、笔画曲率、与图像中心的平均距离、笔压力、笔速度、多个输入笔画之间的时间点、提供输入的总时间或书写方向上的改变。非文本输入分类器本文档来自技高网...
利用预过滤器分类来提高手写识别

【技术保护点】
一种计算机实现的方法,包括:接收指示一个或多个笔画的数据;确定所述一个或多个笔画的一个或多个特征;至少基于所述特征中的一个或多个来确定所述一个或多个笔画是否可能表示字素;从至少以下之中选择用于处理所述数据的特定识别过程:(i)多语言识别过程,所述多语言识别过程利用多个识别器处理输入笔画,所述多个识别器各自被训练为针对给定的一组输入笔画来输出与特定语言相关联的一个或多个字素,和(ii)单字符通用识别过程,所述单字符通用识别过程利用通用识别器处理输入笔画,所述通用识别器被训练为针对给定的一组输入笔画来输出单个字素;以及提供所述数据以利用所述特定识别过程进行处理。

【技术特征摘要】
【国外来华专利技术】2015.09.09 US 14/849,1621.一种计算机实现的方法,包括:接收指示一个或多个笔画的数据;确定所述一个或多个笔画的一个或多个特征;至少基于所述特征中的一个或多个来确定所述一个或多个笔画是否可能表示字素;从至少以下之中选择用于处理所述数据的特定识别过程:(i)多语言识别过程,所述多语言识别过程利用多个识别器处理输入笔画,所述多个识别器各自被训练为针对给定的一组输入笔画来输出与特定语言相关联的一个或多个字素,和(ii)单字符通用识别过程,所述单字符通用识别过程利用通用识别器处理输入笔画,所述通用识别器被训练为针对给定的一组输入笔画来输出单个字素;以及提供所述数据以利用所述特定识别过程进行处理。2.根据权利要求1所述的方法,其中:确定所述一个或多个笔画是否可能表示字素包括确定所述一个或多个笔画可能表示字素,并且其中选择用于处理所述数据的所述特定识别过程包括选择所述多语言识别过程。3.根据权利要求1所述的方法,其中:确定所述一个或多个笔画是否可能表示字素包括确定所述一个或多个笔画不可能表示字素,并且其中选择用于处理所述数据的所述特定识别过程包括选择所述单字符通用识别过程。4.根据权...

【专利技术属性】
技术研发人员:维克托·克尔布内托马斯·德泽莱斯丹尼尔·M·凯泽斯
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1