当前位置: 首页 > 专利查询>SAP欧洲公司专利>正文

字符的视觉感知编码制造技术

技术编号:28758699 阅读:18 留言:0更新日期:2021-06-09 10:32
在一些实施例中,一种方法将一组图像输入到网络中,并基于将一组图像到一组字符中的一个或多个字符的分类来训练网络。该方法基于将该层的输出限制为多个值的网络的层来获得一个或多个字符的一组编码。然后,该方法存储一个或多个字符的一组编码,其中,当确定相应的字符时,该组编码中的编码是可检索的。该组编码中的编码是可检索的。该组编码中的编码是可检索的。

【技术实现步骤摘要】
字符的视觉感知编码


[0001]本专利技术涉及字符的视觉感知编码。

技术介绍

[0002]不同的语言可以基于不同的文字,该文字可以是用于书写语言的字符的书写系统。例如,英语和德语是基于拉丁语文字的,拉丁语文字是具有包括少于100个字符的小字母表的字母文字。其他语言可能会使用具有明显更大的一组字符的语标(logographic)文字。一个示例是普通话,其包括8000多个唯一的字符。英语和普通话字母表具有不同的语言结构、视觉结构、含义和统计频率。
[0003]当使用计算机处理不同语言的文本信息时,首先需要以机器可读格式对字符进行编码。语言的每个字符可以被分配唯一的编码。通常,编码不具有语义含义,因为第一个字符的编码与第二个字符的编码没有关系。这可能会使训练应用识别字符的效率降低,并且还会导致得到的输出具有可识别的错误。

技术实现思路

[0004]本专利技术的一个方面涉及一种方法,该方法包括由计算设备将一组图像输入到网络中;由计算设备基于一组图像到一组字符中的一个或多个字符的分类训练网络;由计算设备基于将层的输出限制为多个值的网络的层、获得一个或多个字符的一组编码;以及由计算设备存储一个或多个字符的一组编码,其中,当确定相应的字符时,该一组编码中的编码是可检索的。
[0005]本专利技术的另一个方面涉及一种其上存储有计算机可执行指令的非暂时性计算机可读存储介质,该计算机可执行指令在由计算设备执行时,使计算设备可操作以将一组图像输入到网络中;基于一组图像到一组字符中的一个或多个字符的分类训练网络;基于将层的输出限制为多个值的网络的层、获得一个或多个字符的一组编码;以及存储一个或多个字符的一组编码,其中,当确定相应的字符时,该一组编码中的编码是可检索的。
[0006]本专利技术的另一个方面涉及一种装置,包括一个或多个计算机处理器;以及包括指令的计算机可读存储介质,该指令用于控制一个或多个计算机处理器可操作以将一组图像输入到网络中;基于一组图像到一组字符中的一个或多个字符的分类训练网络;基于将层的输出限制为多个值的网络的层、获得一个或多个字符的一组编码;以及存储一个或多个字符的一组编码,其中,当确定相应的字符时,该一组编码中的编码是可检索的。
附图说明
[0007]关于随后的讨论,特别是关于附图的讨论,要强调的是,所示细节表示用于说明性讨论目的的示例,并且因为提供对本公开的原理和概念方面的描述而被呈现。就这一点而言,除了基本理解本公开所需要的以外,不试图展示实现细节。下面结合附图进行的讨论对于本领域技术人员而言清楚的是如何可以实践根据本公开的实施例。在各个附图和支持描
述中,相似或相同的附图标记可用于标识或以其他方式指代相似或相同的元件。在附图中:
[0008]图1描绘了根据一些实施例的用于生成字符的编码的简化系统。
[0009]图2描绘了根据一些实施例的训练预测网络以生成编码模型的示例。
[0010]图3描绘了根据一些实施例的标签和图像的示例。
[0011]图4描绘了根据一些实施例的用于训练预测网络的方法的简化的流程图。
[0012]图5描绘了根据一些实施例的预测网络的更详细的示例。
[0013]图6描绘了根据一些实施例的编码的示例。
[0014]图7描绘了根据一些实施例的具有相似二进制码的符号的示例。
[0015]图8示出了根据一个实施例的专用计算机系统的示例。
具体实施方式
[0016]本文所描述的是用于语言编码系统的技术。在下面的描述中,出于解释的目的,阐述了多个示例和具体细节以便提供对一些实施例的透彻理解。如由权利要求书所限定的一些实施例可以单独或结合下面描述的其他特征包括这些示例中的特征中的一些或全部,并且还可以包括本文所描述的特征和概念的修改和等同形式。
[0017]在一些实施例中,系统可以生成表示语言中的字符的编码。例如,编码可以是机器可读格式(例如,二进制码)。系统基于语言中的字符之间的相似性来生成编码。例如,编码可以基于语言中的符号的视觉相似性。相似性可以基于字形(glyph)结构,其中,字形是旨在表示语言中的可读字符的约定的一组符号内的基本符号。在一些实施例中,视觉上相似的符号也可以共享语言中的语义相似性,但是并非对于所有视觉上相似的字符都是这种情况。
[0018]当应用正在处理字符的文本时,通过为被认为视觉上相似的字符生成相似的编码可能是有利的。例如,编码可以提供容错性,因为如果错误地预测了编码中的单个比特或少量比特,则输出的字符可能仍然是与正确的字符视觉上相似的字符。此外,如果仅错误地预测了单个比特,则有可能该编码仍然可以被用于确定正确的字符。此外,即使选择了错误的字符,与输出和正确的字符视觉上不相似的字符相比,输出视觉上相似的字符对用户来说可能不那么混乱。此外,如果编码基于视觉特性,则可以更快地训练被配置为学习字符的过程的训练,因为视觉上相似的字符可以在表示中共享多个比特。因此,该过程将更容易学习相似的比特,然后专注于更具挑战性的比特以区分视觉上相似的字符。
[0019]系统概述
[0020]图1描绘了根据一些实施例的用于生成字符的编码的简化系统100。字符可以来自特定语言(例如,普通话)或其他语标相关的语言。然而,系统100可以用于生成任何语言或多种的编码。
[0021]应用104可以被配置为接收字符(例如,字符的视觉表示),并生成该字符的编码。视觉表示可以是字符的文本表示。字符可以是语标的,其中字符由字母、符号或用于表示整个单词或短语的标志标记。编码可以是机器可读编码,诸如一系列二进制码。然而,编码可以是字符的可以被读取的任何表示,诸如一系列字母或数字。
[0022]应用104可以使用编码来生成输出。例如,应用104可以是光学字符识别(optical character recognition,OCR)引擎,其接收图像并从该图像输出文本。然后,应用104可以
分析文本以生成文本中的字符的编码。一旦生成编码,应用104就可以使用编码来生成输出,该输出可以是字符到另一种语言(例如,英语)的翻译。其他输出可以包括与所识别的字符相对应的表示,例如,相应字符的拼音版本或字符的实际视觉表示。可以理解各种输出。
[0023]应用104可以使用编码模型106来生成编码。编码模型106可以包括语言中的字符的相应编码。编码模型106还可以包括由应用104使用以识别字符并生成相应编码的过程的任何参数。例如,应用104可以使用接收字符的图像并基于编码模型106生成编码的预测网络。然后,应用104生成编码的输出,诸如到另一种语言的字符的翻译。
[0024]如下面将更详细讨论的,视觉上相似的字符的编码也可以相似。在一些实施例中,编码可以是二进制数,诸如N个二进制数的二进制数(例如,010001)。如将在下面更详细地讨论的,编码模型106可以包括对于视觉上相似的字符而言更相似的编码。也就是说,对于在视觉上相似的字符的编码中,多个比特可以是相似的。相似的编码可以意本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种方法,包括:由计算设备将一组图像输入到网络中;由所述计算设备基于所述一组图像到一组字符中的一个或多个字符的分类训练所述网络;由所述计算设备基于将层的输出限制为多个值的所述网络的层、获得所述一个或多个字符的一组编码;以及由所述计算设备存储所述一个或多个字符的所述一组编码,其中,当确定相应的字符时,所述一组编码中的编码是可检索的。2.根据权利要求1所述的方法,其中,所述一组字符中的字符包括一个或多个字形。3.根据权利要求1所述的方法,其中,所述一组字符中的多个字符基于相同的字形。4.根据权利要求1所述的方法,其中,训练所述网络包括:生成所述一组图像中的图像的字符的输出;以及将所述字符的输出与向所述图像分配字符的所述图像的标签进行比较。5.根据权利要求4所述的方法,其中,训练所述网络包括:基于所述比较调整所述网络中的一个或多个参数。6.根据权利要求1所述的方法,其中,获得所述一组编码包括:将所述层的输出限制为固定维度。7.根据权利要求6所述的方法,其中,所述固定维度是所述一组编码中的编码的长度的目标维度。8.根据权利要求7所述的方法,其中,所述固定维度是编码的机器可读数字序列的数量。9.根据权利要求1所述的方法,其中,所述一组编码中的编码包括二进制数字序列。10.根据权利要求1所述的方法,其中,包括相似字形的多个字符被分配具有多个值的相似编码,所述相似编码在相同的位置具有相同的值。11.根据权利要求1所述的方法,还包括:接收图像;将图像分类为字符;以及从所述一组编码中选择与所述字符相对应的编码。12.根据权利要求1所述的方法,其中,所述层是所述网络中的内部层。13.根据...

【专利技术属性】
技术研发人员:J霍尼M斯皮纳奇
申请(专利权)人:SAP欧洲公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1