语境化字符识别系统技术方案

技术编号：29157869 阅读：53 留言：0更新日期：2021-07-06 22:57

这里描述了用于提供语境化字符识别系统的系统、方法和各种实施例。实施例通过确定图像的多个预测单词来操作。识别准确性度量或多个预测单词中的每一个，并且识别具有低于阈值的准确性度量的可替换单词。识别与可替换单词相关联的多个候选单词，并且基于语境分析计算候选单词中的每一个的概率。选择候选单词中的具有最高概率的一个。输出包括替换可替换单词的具有最高概率的选择的候选单词的多个预测单词。

全部详细技术资料下载

【技术实现步骤摘要】
语境化字符识别系统
本公开涉及语境字符识别系统，更具体地，涉及用于提供语境化字符识别系统的系统、装置、设备、方法和/或计算机程序产品。
技术介绍
光学字符识别(OCR)是从图像识别或读取字符或文本的过程。OCR通过将图像中的各种形状和对象与图像的背景区分开来操作。使用视觉特征，OCR随后可以将区分出的形状和对象与一组已知字符比较，以识别可能出现在图像中的各种字符和单词(word)。然而，OCR被限制于使用视觉特征来进行其确定，并且因此有其局限性，因为有时严格使用视觉分析难以识别字符和单词。
技术实现思路
根据本公开的一方面，提供了一种用于提供语境化字符识别系统的方法，包括：确定图像的多个预测单词，其中所述多个预测单词是基于图像的光学分析生成的；为多个预测单词中的每一个识别准确性度量；基于可替换单词的准确性度量低于阈值，从多个可预测单词中识别可替换单词；识别与可替换单词相关联的多个候选单词；基于相对于多个预测单词中的一个或多个的每个候选单词的语境分析，为多个候选单词中的每一个计算概率；选择多个候选单词中的具有最高概率的一个，其中选择的候选单词的概率超过准确性度量和阈值；以及输出包括替换可替换单词的具有最高概率的选择的候选单词的多个预测单词。根据本公开的另一方面，提供了一种用于提供语境化字符识别系统的系统，包括：存储器；以及至少一个处理器，耦合到存储器并被配置为执行操作，所述操作包括：确定图像的多个预测单词，其中所述多个预测单词是基于图像的光学分析生成的；为多个预测单词中的每一个识别准确性度量...

【技术保护点】
1.一种用于提供语境化字符识别系统的方法，包括：/n确定图像的多个预测单词，其中所述多个预测单词是基于图像的光学分析生成的；/n为多个预测单词中的每一个识别准确性度量；/n基于可替换单词的准确性度量低于阈值，从多个可预测单词中识别可替换单词；/n识别与可替换单词相关联的多个候选单词；/n基于相对于多个预测单词中的一个或多个的每个候选单词的语境分析，为多个候选单词中的每一个计算概率；/n选择多个候选单词中的具有最高概率的一个，其中选择的候选单词的概率超过准确性度量和阈值；以及/n输出包括替换可替换单词的具有最高概率的选择的候选单词的多个预测单词。/n

【技术特征摘要】
20200106 US 16/734,8801.一种用于提供语境化字符识别系统的方法，包括：
确定图像的多个预测单词，其中所述多个预测单词是基于图像的光学分析生成的；
为多个预测单词中的每一个识别准确性度量；
基于可替换单词的准确性度量低于阈值，从多个可预测单词中识别可替换单词；
识别与可替换单词相关联的多个候选单词；
基于相对于多个预测单词中的一个或多个的每个候选单词的语境分析，为多个候选单词中的每一个计算概率；
选择多个候选单词中的具有最高概率的一个，其中选择的候选单词的概率超过准确性度量和阈值；以及
输出包括替换可替换单词的具有最高概率的选择的候选单词的多个预测单词。

2.根据权利要求1所述的方法，还包括：
接收图像；
识别图像中的多个字符；以及
将多个字符组合成多个预测单词。

3.根据权利要求1所述的方法，其中基于语境分析计算准确性度量，在语境分析中，出现在多个预测单词中的选择的一个之前的一个或多个预测单词的短语与出现在多个预测单词中的选择的一个之后的一个或多个预测单词的短语进行比较。

4.根据权利要求1所述的方法，其中，所述识别多个候选单词包括：
确定可替换单词包括多个字符；
为多个字符中的至少一个识别替代字符；以及
将包括替代字符的可替换单词识别为是多个候选单词中的一个。

5.根据权利要求4所述的方法，其中所述识别替代字符基于多个字符中的至少一个的光学分析。

6.根据权利要求1所述的方法，其中所述识别多个候选单词包括：
使用具有多个阈值的非最大抑制来生成多个候选单词中的一个。

7.根据权利要求1所述的方法，其中所述识别多个候选单词包括：
跨用于可替换单词中的至少一个字符的多个像素，针对每一个像素识别字符预测，其中可替换单词包括多个字符；
确定跨多个像素存在至少两个不同的预测，包括第一预测和第二预测；以及
识别包括第一预测和多个字符的多个候选单词中的第一个。

8.根据权利要求7所述的方法，还包括：
识别包括第二预测和多个字符的多个候选单词中的第二个。

9.一种用于提供语境化字符识别系统的系统，包括：
存储器；以及
至少一个处理器，耦合到存储器并被配置为执行操作，所述操作包括：
确定图像的多个预测单词，其中所述多个预测单词是基于图像的光学分析生成的；
为多个预测单词中的每一个识别准确性度量；
基于可替换单词的准确性度量低于阈值，从多个可预测单词中识别可替换单词；
识别与可替换单词相关联的多个候选单词；
基于相对于多个预测单词中的一个或多个的每个候选单词的语境分析，为多个候选单词中的每一个计算概率；
选择多个候选单词中的具有最高概率的一个，其中选择的候选单词的概率超过准确性度量和阈值；以及
输出包括替换可替换单词的具有最高概率的选择的候...

【专利技术属性】
技术研发人员：RK古普塔，J赫内，AR卡蒂，
申请(专利权)人：SAP欧洲公司，
类型：发明
国别省市：德国;DE

全部详细技术资料下载我是这个专利的主人