文字识别方法、装置及电子设备制造方法及图纸

技术编号:26304867 阅读:31 留言:0更新日期:2020-11-10 20:01
本申请公开了一种文字识别方法、装置及电子设备,涉及计算机视觉技术领域。其中,该方法包括:获取待识别图像,待识别图像包括待识别文字,待识别文字包括至少一个字符组,字符组包括至少一个字符;从待识别图像中提取图像特征,并根据图像特征确定待识别文字所对应候选文字的第一编码序列以及第一概率;根据候选文字的第二编码序列,获取候选文字对应的第二概率;根据第一概率和第二概率,从各候选文字的第一编码序列中确定待识别文字对应的目标编码序列,并将目标编码序列所表示的候选文字确定为待识别文字的识别结果。如此,可以有效降低字符组识别出错的几率,进而降低待识别文字识别出错的几率。

【技术实现步骤摘要】
文字识别方法、装置及电子设备
本申请涉及计算机视觉
,更具体地,涉及一种文字识别方法、装置、电子设备及存储介质。
技术介绍
人工智能(ArtificialIntelligence,AI)是利用数字计算机或者数字计算机控制机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。随着人工智能技术的飞速发展,其在图像文字识别(OpticalCharacterRecognition,OCR)领域得到了广泛应用。但是,现有的识别方法对于一些特定语言的文字的识别准确度较差。
技术实现思路
本申请提出了一种文字识别方法、装置及电子设备及存储介质,可以改善上述问题。一方面,本申请实施例提供了一种文字识别方法,包括:获取待识别图,待识别图像包括待识别文字,待识别文字包括至少一个字符组,该字符组包括至少一个字符组;从待识别图像中提取图像特征,并根据图像特征确定与待识别文字所对应候选文字的第一编码序列以及第一概率,所述第一编码序列包括候选文字中各字符组的编码信息,第一概率表示待识别文字是该候选文字的概率;根据候选文字的第二编码序列,获取候选文字对应的第二概率,第二编码序列包括候选文字中各字符的编码信息,第二概率表示候选文字是正确文字的概率;根据第一概率和第二概率,从各候选文字的第一编码序列中确定待识别文字对应的目标编码序列,并将目标编码序列所表示的候选文字确定为待识别文字的识别结果。另一方面,本申请实施例提供了一种文字识别装置,包括:获取模块、确定模块以及识别模块。其中,获取模块用于获取待识别图像,待识别图像包括待识别文字,待识别文字包括至少一个字符组,字符组包括至少一个字符。确定模块用于从待识别图像中提取图像特征,并根据图像特征确定与待识别文字所对应候选文字的第一编码序列以及第一概率,所述第一编码序列包括候选文字中各字符组的编码信息,第一概率表示待识别文字是候选文字的概率;根据候选文字的第二编码序列,获取候选文字对应的第二概率,第二编码序列包括候选文字中各字符的编码信息,第二概率表示候选文字是正确文字的概率。识别模块用于根据第一概率和第二概率,从各候选文字的第一编码序列中确定待识别文字对应的目标编码序列,并将目标编码序列所表示的候选文字确定为待识别文字的识别结果。另一方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储器;一个或多个程序,其中所述一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述的方法。另一方面,本申请实施例提供了一种计算机可读存储介质,其上存储有程序代码,所述程序代码可被处理器调用执行上述的方法。本申请提供的方案,对于包括待识别文字的待识别图像,可以从待识别图像中提取图像特征,并根据图像特征确定与待识别文字所对应候选文字的第一编码序列以及第一概率,根据候选文字的第二编码序列获取候选文字对应的第二概率。其中,待识别文字包括至少一个字符组,字符组包括至少一个字符。第一编码序列包括候选文字中各字符组的编码信息,第一概率表示待识别文字是候选文字的概率,第二编码序列包括候选文字中各字符的编码信息,第二概率表示候选文字是正确文字的概率。然后,可以根据第一概率和第二概率,从各候选文字的第一编码序列中确定待识别文字对应的目标编码序列,并将目标编码序列所表示的候选文字确定为待识别文字的识别结果。如此,在基于第一概率确定待识别文字是哪一个候选文字时,可以以基于第二编码序列得到的第二概率为约束条件,从而有效降低因字符组识别有误而将待识别文字识别为错误的候选文字的几率。本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示出了本申请一实施例提供的一种文字识别方法的流程图。图2A示出了一个藏文文字的示意图。图2B示出了图2A所示藏文文字的字符序列和字符组序列的示意图。图2C示出了几个字符组的堆编码示意图。图3示出了本申请另一实施例提供的一种文字识别方法的流程图。图4示出了本申请实施例提供的一种文字识别模型的架构示意图。图5示出了本申请实施例提供的一个例子中字符编码约束模型的训练流程。图6示出了图4所示实施例中的文字识别方法的另一流程图。图7示出了本申请又一实施例提供的一种文字识别方法的流程图。图8示出了本申请实施例提供的一个待识别图像的识别结果示意图。图9示出了本申请实施例提供的另一个待识别图像的识别结果示意图。图10示出了本申请实施例提供的一种文字识别装置的框图。图11是本申请实施例的用于执行根据本申请实施例的文字识别方法的电子设备的框图。图12是本申请实施例的用于保存或者携带实现根据本申请实施例的文字识别方法的程序代码的存储单元。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。图像是承载和传播文字信息的一种常见方式,针对这种方式,需要使用图像识别技术识别图像中携带的文字信息的具体内容。传统的图像识别技术包括光学字符识别(OpticalCharacterRecognition,OCR),其可以从图像中识别出文字信息的具体内容,并可以将图像所携带的文字转换成文本信息以供后续应用和处理。对于一些语言的文字,采用常规的识别方式,识别结果不佳。针对上述问题,专利技术人经过长期研究,提出了一种文字识别方法、装置及电子设备,可以提升文字识别的准确度。该方法可以由电子设备执行,这里的电子设备可以是服务器或终端设备。终端设备可以是智能手机、平板电脑、笔记本电脑、个人计算机(PersonalComputer,PC)、便携式穿戴式设备等。服务器可以是,独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算、大数据和人工智能平台等基础云计算服务的云服务器。在本申请实施例的一个应用场景中,如果需要对图像中的文字进行识别,终端设备或者服务器可以获得待识别图像,比如可以通过图像采集设备(比如,摄像头)采集待识别图,或者可以是接收其他设备通过数据传输方式传输的待识别图像。终端设备或服务器可以通过配置的文字识别模型对获得的待识别图像进行识别,从而得到该待识别图像中的待识别文字。请参照图1,图1示出了本申请一实施例提供的一种文字识别方法的流程示意图,该方法可以应用于上述的电子设备中。该方法可以包括以下步骤:步骤S110,获取待识别图像,所述待识别图像包括待识别文字,所述待识别文字包括至少一个字符组,所述字符组包括至少一个字符。其中,待识别图像是本文档来自技高网
...

【技术保护点】
1.一种文字识别方法,其特征在于,所述方法包括:/n获取待识别图像,所述待识别图像包括待识别文字,所述待识别文字包括至少一个字符组,所述字符组包括至少一个字符;/n从所述待识别图像中提取图像特征,并根据所述图像特征确定与所述待识别文字所对应候选文字的第一编码序列以及第一概率,所述第一编码序列包括所述候选文字中各字符组的编码信息,所述第一概率表示所述待识别文字是所述候选文字的概率;/n根据所述候选文字的第二编码序列,获取所述候选文字对应的第二概率,所述第二编码序列包括所述候选文字中各字符的编码信息,所述第二概率表示所述候选文字是正确文字的概率;/n根据所述第一概率和所述第二概率,从各所述候选文字的第一编码序列中确定所述待识别文字对应的目标编码序列,并将所述目标编码序列所表示的候选文字确定为所述待识别文字的识别结果。/n

【技术特征摘要】
1.一种文字识别方法,其特征在于,所述方法包括:
获取待识别图像,所述待识别图像包括待识别文字,所述待识别文字包括至少一个字符组,所述字符组包括至少一个字符;
从所述待识别图像中提取图像特征,并根据所述图像特征确定与所述待识别文字所对应候选文字的第一编码序列以及第一概率,所述第一编码序列包括所述候选文字中各字符组的编码信息,所述第一概率表示所述待识别文字是所述候选文字的概率;
根据所述候选文字的第二编码序列,获取所述候选文字对应的第二概率,所述第二编码序列包括所述候选文字中各字符的编码信息,所述第二概率表示所述候选文字是正确文字的概率;
根据所述第一概率和所述第二概率,从各所述候选文字的第一编码序列中确定所述待识别文字对应的目标编码序列,并将所述目标编码序列所表示的候选文字确定为所述待识别文字的识别结果。


2.根据权利要求1所述的方法,其特征在于,所述根据所述第一概率和所述第二概率,从各所述候选文字的第一编码序列中确定所述待识别文字对应的目标编码序列,包括:
从各所述候选文字的第一编码序列中确定使所述第一概率和所述第二概率的乘积取得最大值的候选文字的第一编码序列,并将该候选文字的第一编码序列确定为所述待识别文字对应的目标编码序列。


3.根据权利要求1或2所述的方法,其特征在于,所述根据所述候选文字的第二编码序列,获取所述候选文字对应的第二概率,包括:
获取字符编码约束模型基于所述第二编码序列输出的正确性分数;
对所述正确性分数进行归一化,并将归一化后的正确性分数确定为所述第二概率。


4.根据权利要求3所述的方法,其特征在于,所述待识别文字是元音标注文字,所述字符编码约束模型通过以下方式训练得到:
获取正样本数据和负样本数据,所述正样本数据包括正确的元音标注文字中各字符的编码信息,所述负样本数据包括错误的元音标注文字中各字符的编码信息;
获取字符编码约束模型基于所述正样本数据输出的第一得分,以及基于所述负样本数据输出的第二得分;
基于所述第一得分和所述第二得分调整所述字符编码约束模型的模型参数,使调整后的字符约束编码模型输出的第一得分和第二得分的差距增大。


5.根据权利要求1或2所述的方法,其特征在于,所述第二编码序列为所述候选文字中各字符的编码信息按照所述候选文字的书写顺序排列而成的序列,所述根据所述候选文字的第二编码序列,获取所述候选文字对应的第二概率,包括:
针对所述第二编码序列中第i个字符的编码信息,获取在所述第i个字符之前的N个字符的编码信息出现的情况下,所述第i个字符的编码信息出现的条件概率,其中,N为大于1的正整数,1≤i≤N,i为正整数;
将所述候选文字中各字符的编码信息的条件概率的乘积,确定为所述第二概率。

【专利技术属性】
技术研发人员:康健黄珊
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1