【技术实现步骤摘要】
一种基于深度学习的试卷自动转录系统及方法
本专利技术涉及图像目标检测与识别
,具体为一种基于深度学习的试卷自动转录系统及方法。
技术介绍
近年来,以卷积神经网络为基础的深度学习技术在计算机视觉领域取得突破性进展,极大提升了图像处理领域应用研究,尤其以目标检测和OCR(光学字符识别)为代表的技术在智能交通、视频监控、无人驾驶、AI教育等领域得到广泛应用。同时,深度学习技术在教育领域的应用也越来越多,如人脸识别、手写识别、拍图搜题等。目前,深度学习技术在试卷文档分析中的应用并不多,其主要侧重于试卷文档分析、试卷图文分离、试卷笔迹鉴定等场景。而将试卷内容从图片自动转录为Word版本的电子版格式需求成为当前教师出题中的热点需求,实现一份拍照试卷的自动转录将有利于教师出题过程对题目重组与修改,极大节省教师出题时间,并提高工作效率。而在当前教学工作中,试卷转录工作依然需要人工干预,转录过程耗时、效率低下。基于以上现状,本方法借助深度学习技术实现试卷自动转录,提出一种基于深度学习的试卷自动转录系统及方法。本方法根据试 ...
【技术保护点】
1.一种基于深度学习的试卷自动转录系统及方法,其特征在于:该系统基于深度学习技术,主要包含数据自动化生成、图表检测、文字行检测、公式检测、OCR识别和后处理等步骤。/n
【技术特征摘要】
1.一种基于深度学习的试卷自动转录系统及方法,其特征在于:该系统基于深度学习技术,主要包含数据自动化生成、图表检测、文字行检测、公式检测、OCR识别和后处理等步骤。
2.根据权利要求1所述的一种基于深度学习的试卷自动转录的方法,其特征在于:所述主要特征具体描述为:使用仿真程序自动化生成文字行检测、图表检测和OCR等算法需要的训练数据,图表检测负责将试卷中图片与文字区域分离,文字行和公式检测负责对试卷中所有文字行(公式)进行检测,OCR识别负责对检测到的文字行和公式进行识别,后处理过程将识别与检测结果重新排版,并按试卷原样格式输出Word格式。
3.根据权利要求1所述的一种基于深度学习的试卷自动转录的方法,其特征在于:所述数据自动化生成具体描述为:使用程序设计语言自动生成和真实样本高度相似的训练数据,通过程序控制,在仿真数据过程中,随机生成指定数量的包含图表、文字行、公式等在内的各种版面试卷图片及label数据。
4.根据权利要求1所述的一种基于深度学习的试卷自动转录的方法,其特征在于:所述图表检测具体描述为:使用轻量级的SSD-Mobilenetv2网络作为图表检测网络,输入图像大小为224x224,使用Mobilenetv2作为主干网络提取特征,基于SSD的多层特征分别对图像中的图表区域进行检测,从而得到图表区域位置坐标信息。
5.根据权利要求1所述的一种基于深度学习的试卷自动转录的方法,其特征在于:所述文字行检测具体描述为:使用自然场景下的文字行检测算法AdvanceEAST作为文字行检测网络,试卷图片在拍摄或扫描过程可能存在摆放位置倾斜等情况,此时如果使用基于两点定位的算法则会出现对文字行定位不准的情况,因此本方法中对文字行定位使用四点定位算法,当图片存在倾斜时,对文字行四点坐标进行透视变换即可将文字行区域摆正;本方法使用1280x192大小分辨率图像作为输入,对图像中所有文字行定位,从而得到试卷图像中文字行位置坐标信息,并将该坐标还原到原始图像区域进行透视变换。考虑到文字行中公式高度大于文字行高度问题,对文字行坐标进行5个像素点的外扩,从而保证从原始图像截取出来的每行文字中包括完整公式区域。
6.根据权利要求1所述的一种基于深度学习的试卷自动转录的方法,其特征在于:所述公式检测具体描述为:该步骤使用CTPN算法作为公式检测网络,以文字行检测结果输出为输入,从而对每个文字行中是否存在公式进行检测,...
【专利技术属性】
技术研发人员:严军峰,侯冲,陈家海,叶家鸣,吴波,
申请(专利权)人:安徽七天教育科技有限公司,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。