【技术实现步骤摘要】
一种文字图像识别纠错方法和电子设备
[0001]本专利技术涉及计算机视觉和自然语言处理
,更具体地说,涉及一种文字图像识别纠错方法和电子设备。
技术介绍
[0002]文字图像,即包括文字信息的图像。目前,识别图像中的文字作为计算机视觉中的一种常用技术,被广泛应用于文档信息提取、证照识别、资质审核等实际项目中,特别是在RPA (Robotic Process Automation,机器人流程自动化)项目中有着普遍应用。在研发过程中,文字图像识别算法通常使用海量数据训练,得到一个在测试集上效果比较理想的模型。但在某些实际使用场景,往往会出现测试集中没有出现的数据,文字图像识别算法的准确率会因此打折。
[0003]识别图像中文字时,由于图像中文字大小、形状、颜色等表达的多样性,往往会产生错误的识别结果,因此现文字图像识别中均包括纠错步骤。现有技术的纠错方式主要是在训练文字识别模型阶段进行优化,如收集更多的实际使用场景数据加入到模型训练,或为一些非常重要的场景单独训练一个文字图像识别模型,用于克服识别过程中的纠错,但是 ...
【技术保护点】
【技术特征摘要】
1.一种文字图像识别纠错方法,其特征在于,包括以下步骤:对文字图像进行文字识别,预处理文字识别结果,过滤出所述文字识别结果的潜在错误结果;构建候选替换集合;基于语言模型,用所述候选替换集合中的文字逐一替换所述潜在错误结果,并计算每次潜在错误结果替换后文字序列的合理性得分;将所有合理性得分排序,输出合理性得分最高的文字序列作为纠错后输出结果。2.根据权利要求1所述的一种文字图像识别纠错方法,其特征在于,对于包括多个所述潜在错误结果的文字识别结果,结合所有所述潜在错误结果替换后的文字序列计算合理性得分。3.根据权利要求1或2所述的一种文字图像识别纠错方法,其特征在于,所述基于语言模型,用所述候选替换集合中的文字逐一替换所述潜在错误结果,并计算每次潜在错误结果替换后文字序列的合理性得分,包括:确认包括所述潜在错误结果在内的子文字单元,通过语言模型对子文字单元进行识别;对于语言模型中不包括的子文字单元,使用所述候选替换集合中的文字替换所述潜在错误结果,计算替换后文字序列的合理性得分。4.根据权利要求3所述的一种文字图像识别纠错方法,其特征在于,所述子文字单元为包括所述潜在错误结果的文字单元。5.根据权利要求1所述的一种文字图像识别纠错方法,其特征在于,所述合理性得分计算是根据语言模型,计算文字序列中文字出现的概率。6.根据权利要求5所述的一种文...
【专利技术属性】
技术研发人员:宋祺,张睿,燕鹏举,周健,
申请(专利权)人:上海弘玑信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。