一种文字识别方法及装置制造方法及图纸

技术编号:23344627 阅读:28 留言:0更新日期:2020-02-15 04:17
本申请提供了一种文字识别方法及装置,方法包括:将从作业页面中提取出的文本框图像输入卷积神经网络模型,得到卷积神经网络模型输出的识别概率矩阵;在作业页面中存在答案的情况下,每次分别从各个字符概率集合中获取一个字符概率,并将字符概率对应的字符进行组合,得到字符串,直至各个字符概率集合中的各个字符概率均被获取过K次;利用CTC思想对字符串进行修正,并基于修正后的字符串,确定识别结果;在作业页面不存在答案的情况下,利用N‑gram语法修正模型,对各个字符概率集合中字符概率对应的字符进行修正,并得到识别结果,并利用CTC思想对识别结果进行修正。在本申请中,通过以上方式可以提高答案文字识别的准确性。

A method and device of character recognition

【技术实现步骤摘要】
一种文字识别方法及装置
本申请涉及作业批改
,特别涉及一种文字识别方法及装置。
技术介绍
目前,对学生的作业实现自动批改的关键步骤包括:识别出作业图像中所包含的文字信息。但是,如何准确地识别出作业图像中所包含的文字信息成为问题。
技术实现思路
为解决上述技术问题,本申请实施例提供一种文字识别方法及装置,以达到提高答案文字识别的准确性的目的,技术方案如下:一种文字识别方法,包括:将从作业页面中提取出的文本框图像输入预先训练好的卷积神经网络模型,得到所述卷积神经网络模型输出的识别概率矩阵;所述识别概率矩阵包括多个字符概率集合,每个字符概率集合分别对应所述文本框图像中的不同字符位置,所述字符概率集合包括:按照从大到小的顺序,排列在前K个的字符概率,所述K为不小于1的整数;在所述作业页面中存在答案的情况下,每次分别从各个所述字符概率集合中获取一个字符概率,并将获取到的字符概率对应的字符进行组合,得到字符串,直至各个所述字符概率集合中的各个字符概率均被获取过所述K次;<br>若所述字符串中本文档来自技高网...

【技术保护点】
1.一种文字识别方法,其特征在于,包括:/n将从作业页面中提取出的文本框图像输入预先训练好的卷积神经网络模型,得到所述卷积神经网络模型输出的识别概率矩阵;/n所述识别概率矩阵包括多个字符概率集合,每个字符概率集合分别对应所述文本框图像中的不同字符位置,所述字符概率集合包括:按照从大到小的顺序,排列在前K个的字符概率,所述K为不小于1的整数;/n在所述作业页面中存在答案的情况下,每次分别从各个所述字符概率集合中获取一个字符概率,并将获取到的字符概率对应的字符进行组合,得到字符串,直至各个所述字符概率集合中的各个字符概率均被获取过所述K次;/n若所述字符串中任意两个相邻字符中第一个字符非空格符且所...

【技术特征摘要】
1.一种文字识别方法,其特征在于,包括:
将从作业页面中提取出的文本框图像输入预先训练好的卷积神经网络模型,得到所述卷积神经网络模型输出的识别概率矩阵;
所述识别概率矩阵包括多个字符概率集合,每个字符概率集合分别对应所述文本框图像中的不同字符位置,所述字符概率集合包括:按照从大到小的顺序,排列在前K个的字符概率,所述K为不小于1的整数;
在所述作业页面中存在答案的情况下,每次分别从各个所述字符概率集合中获取一个字符概率,并将获取到的字符概率对应的字符进行组合,得到字符串,直至各个所述字符概率集合中的各个字符概率均被获取过所述K次;
若所述字符串中任意两个相邻字符中第一个字符非空格符且所述第一个字符与第二个字符相同,则将所述两个相邻字符中选择一个删除,得到第一修正后字符串;
将所述第一修正后字符串中的空格符删除,得到第二修正后字符串;
将各个所述第二修正后字符串分别与标准答案字符串比较,得到比较结果;
若比较结果为一致,则将所述第二修正后字符串作为识别结果。


2.根据权利要求1所述的方法,其特征在于,所述每次分别从各个所述字符概率集合中获取一个字符概率,并将获取到的字符概率对应的字符进行组合,得到字符串,直至各个所述字符概率集合中的各个字符概率均被获取过所述K次,包括:
每次分别从各个所述字符概率集合中获取一个字符概率,并对获取到的字符概率进行累加,将累加的结果作为总概率,直至各个所述字符概率集合中的各个字符概率均被获取过所述K次;
按照从大到小的顺序,从多个所述总概率中选取排列在前N个的总概率,所述N为不小于1的整数;
分别将所述排列在前N个的总概率中各个总概率,对应的参与累加的字符概率对应的字符进行组合,得到字符串。


3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若各个所述比较结果均为不一致,则分别从各个所述字符概率集合中获取最大字符概率,并将获取到的最大字符概率对应的字符进行组合,得到组合结果;
若所述组合结果中任意两个相邻字符中第一个字符非空格符且所述第一个字符与第二个字符相同,则将所述两个相邻字符中选择一个删除,得到第一修正后组合结果;
将所述第一修正后组合结果中的空格符删除,得到第二修正后组合结果,并将所述第二修正后组合结果作为识别结果。


4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述作业页面中不存在答案的情况下,利用预先训练好的N-gram语法修正模型,对各个所述字符概率集合中字符概率对应的字符进行修正,并得到识别结果;
所述N-gram语法修正模型为预先利用具备标准语法的语料训练样本训练得到。


5.根据权利要求4所述的方法,其特征在于,所述利用预先训练好的N-gram语法修正模型,对各个所述字符概率集合中字符概率对应的字符进行修正,并得到识别结果,包括:
按照所述文本框图像中字符位置从前到后的排列顺序,对所述识别概率矩阵中未被遍历的字符概率集合进行遍历;
若遍历到的字符概率集合对应所述文本框图像中第一个字符位置,则将遍历到的字符概率集合中最大字符概率对应的字符作为输出字符;
若遍历到的字符概率集合对应所述文本框图像中非第一个字符位置,则分别将所述遍历到的字符概率集合中每个字符概率对应的字符,与之前...

【专利技术属性】
技术研发人员:曹润东赵晖饶丰
申请(专利权)人:北京一起教育信息咨询有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1