一种手写公式的识别方法及计算设备技术

技术编号:19593947 阅读:43 留言:0更新日期:2018-11-28 05:04
本发明专利技术公开了一种手写公式的识别方法及计算设备,计算设备中存储有预先训练好的手写字符识别模型,该方法包括:获取待识别图像,并检测出待识别图像中的各连通域;对检测出的每一个连通域,找出该连通域中最长的横线,判断该最长的横线是否为有效横线;若该连通域中最长的横线为有效横线,则根据该有效横线确定该连通域对应的分式结构图像;将该连通域对应的分式结构图像输入到手写字符识别模型中进行识别,以提取出该分式结构图像所包含的内容;根据预设的判断规则,确定该分式结构图像所包含的内容是否为手写分式。

【技术实现步骤摘要】
一种手写公式的识别方法及计算设备
本专利技术涉及图像处理
,特别涉及一种手写公式的识别方法及计算设备。
技术介绍
随着计算机和互联网技术的发展,人们越来越多的使用自动化设备对学生考试试卷进行阅卷。在试卷分析时,经常需要对手写字体进行识别,特别是对于如数学、物理等理工科目来说,手写字体中还存在有大量的手写公式,而手写公式比较随意,文字之间连笔、断笔的情况很多,文字与文字之间互相粘连,文字的大小、上下左右的对齐都不规律,公式的结构包括上下、左右及嵌套等,非常复杂。目前,对于写公式进行识别的方式主要有两种:第一种是基于传统的公式切割后再识别,这种方式主要是对公式结构进行图像处理以及规则检测,再进行字符切割和识别,对于长公式结构检测很准确,但对连笔和字符粘连情况,很难切割识别,另外基于规则的公式检测,因为手写公式的随意性,规则并不总是有效,对于短公式结构会产生一些误检和漏检;第二种是基于端到端的手写字符识别深度学习方法,这种方法对于连笔、字符粘连以及基本的从左到右书写的字符,识别准确度都很高,但对于复杂公式来说,例如长分式结构,具有分子、分母的上下结构,分子和分母结构也比较复杂,或分式本文档来自技高网...

【技术保护点】
1.一种手写公式的识别方法,适于在计算设备中执行,所述计算设备中存储有预先训练好的手写字符识别模型,所述方法包括:获取待识别图像,并检测出所述待识别图像中的各连通域;对检测出的每一个连通域,找出该连通域中最长的横线,判断该最长的横线是否为有效横线;若该连通域中最长的横线为有效横线,则根据该有效横线确定该连通域对应的分式结构图像;将该连通域对应的分式结构图像输入到所述手写字符识别模型中进行识别,以提取出该分式结构图像所包含的内容;根据预设的判断规则,确定该分式结构图像所包含的内容是否为手写分式。

【技术特征摘要】
1.一种手写公式的识别方法,适于在计算设备中执行,所述计算设备中存储有预先训练好的手写字符识别模型,所述方法包括:获取待识别图像,并检测出所述待识别图像中的各连通域;对检测出的每一个连通域,找出该连通域中最长的横线,判断该最长的横线是否为有效横线;若该连通域中最长的横线为有效横线,则根据该有效横线确定该连通域对应的分式结构图像;将该连通域对应的分式结构图像输入到所述手写字符识别模型中进行识别,以提取出该分式结构图像所包含的内容;根据预设的判断规则,确定该分式结构图像所包含的内容是否为手写分式。2.如权利要求1所述的方法,其中,设某连通域所在位置的图像宽度为M、高度为N,则找出该连通域中最长的横线的步骤包括:将连通域中的每个点标记为一个二维节点ai,j,i=1,2…,M,j=1,2…,N;根据该连通域所在位置的图像建立横向有向图,其中若点ai,j为背景色节点,则其没有任何边,若其非背景色节点,则分别将其到点ai+1,j-1、点ai+1,j和点ai+1,j+1之间作为该横向有向图中的一条边;以及采用预定算法找出到达点aM,j的最长路径,该最长路径所在线条即为该连通域中最长的横线。3.如权利要求2所述的方法,其中,到达点aM,j的最长路径P(aM,j)=Max(P(aM-1,j-1)+w(aM-1,j-1,aM,j),P(aM-1,j+1)+w(aM-1,j+1,aM,j),P(aM-1,j)+w(aM-1,j,aM,j)),Max表示取最大值,w(ax,ay)表示有向边<ax,ay...

【专利技术属性】
技术研发人员:刘辉郭龙刘宁徐行张东祥陈李江
申请(专利权)人:宁波云江互联网科技有限公司
类型:发明
国别省市:浙江,33

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1