【技术实现步骤摘要】
文字识别方法、装置及电子设备
本申请涉及计算机视觉
,更具体地,涉及一种文字识别方法、装置、电子设备及存储介质。
技术介绍
人工智能(ArtificialIntelligence,AI)是利用数字计算机或者数字计算机控制机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。随着人工智能技术的飞速发展,其在图像文字识别(OpticalCharacterRecognition,OCR)领域得到了广泛应用。但是,现有的识别方法对于一些特定语言的文字的识别准确度较差。
技术实现思路
本申请提出了一种文字识别方法、装置及电子设备及存储介质,可以改善上述问题。一方面,本申请实施例提供了一种文字识别方法,包括:获取待识别图,待识别图像包括待识别文字,待识别文字包括至少一个字符组,该字符组包括至少一个字符组;从待识别图像中提取图像特征,并根据图像特征确定与待识别文字所对应候选文字的第一编码序列以及第一概率,所述第一编码序列包括候选文字中各字符组的编码信息,第一概率表示待识别文字是该候选文字的概率;根据候选文字的第二编码序列,获取候选文字对应的第二概率,第二编码序列包括候选文字中各字符的编码信息,第二概率表示候选文字是正确文字的概率;根据第一概率和第二概率,从各候选文字的第一编码序列中确定待识别文字对应的目标编码序列,并将目标编码序列所表示的候选文字确定为待识别文字的识别结果。另一方面,本申请实施例提供了一种文字识别装置,包括:获取模块、确 ...
【技术保护点】
1.一种文字识别方法,其特征在于,所述方法包括:/n获取待识别图像,所述待识别图像包括待识别文字,所述待识别文字包括至少一个字符组,所述字符组包括至少一个字符;/n从所述待识别图像中提取图像特征,并根据所述图像特征确定与所述待识别文字所对应候选文字的第一编码序列以及第一概率,所述第一编码序列包括所述候选文字中各字符组的编码信息,所述第一概率表示所述待识别文字是所述候选文字的概率;/n根据所述候选文字的第二编码序列,获取所述候选文字对应的第二概率,所述第二编码序列包括所述候选文字中各字符的编码信息,所述第二概率表示所述候选文字是正确文字的概率;/n根据所述第一概率和所述第二概率,从各所述候选文字的第一编码序列中确定所述待识别文字对应的目标编码序列,并将所述目标编码序列所表示的候选文字确定为所述待识别文字的识别结果。/n
【技术特征摘要】 【专利技术属性】
1.一种文字识别方法,其特征在于,所述方法包括:
获取待识别图像,所述待识别图像包括待识别文字,所述待识别文字包括至少一个字符组,所述字符组包括至少一个字符;
从所述待识别图像中提取图像特征,并根据所述图像特征确定与所述待识别文字所对应候选文字的第一编码序列以及第一概率,所述第一编码序列包括所述候选文字中各字符组的编码信息,所述第一概率表示所述待识别文字是所述候选文字的概率;
根据所述候选文字的第二编码序列,获取所述候选文字对应的第二概率,所述第二编码序列包括所述候选文字中各字符的编码信息,所述第二概率表示所述候选文字是正确文字的概率;
根据所述第一概率和所述第二概率,从各所述候选文字的第一编码序列中确定所述待识别文字对应的目标编码序列,并将所述目标编码序列所表示的候选文字确定为所述待识别文字的识别结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一概率和所述第二概率,从各所述候选文字的第一编码序列中确定所述待识别文字对应的目标编码序列,包括:
从各所述候选文字的第一编码序列中确定使所述第一概率和所述第二概率的乘积取得最大值的候选文字的第一编码序列,并将该候选文字的第一编码序列确定为所述待识别文字对应的目标编码序列。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述候选文字的第二编码序列,获取所述候选文字对应的第二概率,包括:
获取字符编码约束模型基于所述第二编码序列输出的正确性分数;
对所述正确性分数进行归一化,并将归一化后的正确性分数确定为所述第二概率。
4.根据权利要求3所述的方法,其特征在于,所述待识别文字是元音标注文字,所述字符编码约束模型通过以下方式训练得到:
获取正样本数据和负样本数据,所述正样本数据包括正确的元音标注文字中各字符的编码信息,所述负样本数据包括错误的元音标注文字中各字符的编码信息;
获取字符编码约束模型基于所述正样本数据输出的第一得分,以及基于所述负样本数据输出的第二得分;
基于所述第一得分和所述第二得分调整所述字符编码约束模型的模型参数,使调整后的字符约束编码模型输出的第一得分和第二得分的差距增大。
5.根据权利要求1或2所述的方法,其特征在于,所述第二编码序列为所述候选文字中各字符的编码信息按照所述候选文字的书写顺序排列而成的序列,所述根据所述候选文字的第二编码序列,获取所述候选文字对应的第二概率,包括:
针对所述第二编码序列中第i个字符的编码信息,获取在所述第i个字符之前的N个字符的编码信息出现的情况下,所述第i个字符的编码信息出现的条件概率,其中,N为大于1的正整数,1≤i≤N,i为正整数;
将所述候选文字中各字符的编码信息的条件概率的乘积,确定为所述第二概率。
技术研发人员:康健,黄珊,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。