文本检测方法、电子设备及计算机可读介质技术

技术编号:25835542 阅读:31 留言:0更新日期:2020-10-02 14:16
本发明专利技术实施例公开了一种文本检测方法、电子设备和计算机可读介质,其中,文本检测方法包括:对待处理文本图像进行特征提取及特征融合,获得融合特征图,其中,待处理文本图像中包含第一文本类型的第一文本和第二文本类型的第二文本;基于融合特征图进行文本分类检测,获得用于区分所述第一文本和所述第二文本的文本分类特征图;并且,对融合特征图进行文本边界检测,获得用于指示融合特征图中的文本边界的文本边界特征图;将文本分类特征图和文本边界特征图进行匹配,获得第一文本对应的第一文本边界和第二文本对应的第二文本边界。通过本发明专利技术实施例,有效提升了针对同时包含不同文本类型文本的文本图像的检测和处理效率。

【技术实现步骤摘要】
文本检测方法、电子设备及计算机可读介质
本专利技术实施例涉及计算机
,尤其涉及一种文本检测方法、电子设备和计算机可读介质。
技术介绍
现在的教育教学场景中,学生的作业或试卷大多仍然采用人工方式进行批阅,为家长和老师带来了巨大的批阅负担。为此,多种自动判题、自动阅卷的方法应运而生。因学生的作业或试卷中,通常打印体文本和学生手写的文本混杂,不便于机器判断和识别。为了方便对作业和试卷进行机器处理,目前采用的方式是,作业或试卷仅用于学生读题,而答案或选项则需要学生涂写在对应的答题卡上。然后,通过自动判题系统对学生涂写的答题卡进行计算机识别。但是,这种方法对学生答题来说无形中增加了答题时间成本,甚至容易出现填涂错误、漏涂的现象。有些主观题需要学生将答案写在固定方框内,当手写答案超出答题区时会出现漏判问题。因此,如何在文本图像中同时包含两种文本类型的文本时,如同时包含有打印体文本和手写体文本时,简单、准确地对文本类型进行区分和有效处理,成为亟待解决的问题。
技术实现思路
本专利技术提供了一种文本检测方案,以至少部分本文档来自技高网...

【技术保护点】
1.一种文本检测方法,其特征在于,包括:/n对待处理文本图像进行特征提取及特征融合,获得融合特征图,其中,所述待处理文本图像中包含第一文本类型的第一文本和第二文本类型的第二文本;/n基于所述融合特征图进行文本分类检测,获得用于区分所述第一文本和所述第二文本的文本分类特征图;并且,对所述融合特征图进行文本边界检测,获得用于指示所述融合特征图中的文本边界的文本边界特征图;/n将所述文本分类特征图和所述文本边界特征图进行匹配,获得所述第一文本对应的第一文本边界和所述第二文本对应的第二文本边界。/n

【技术特征摘要】
1.一种文本检测方法,其特征在于,包括:
对待处理文本图像进行特征提取及特征融合,获得融合特征图,其中,所述待处理文本图像中包含第一文本类型的第一文本和第二文本类型的第二文本;
基于所述融合特征图进行文本分类检测,获得用于区分所述第一文本和所述第二文本的文本分类特征图;并且,对所述融合特征图进行文本边界检测,获得用于指示所述融合特征图中的文本边界的文本边界特征图;
将所述文本分类特征图和所述文本边界特征图进行匹配,获得所述第一文本对应的第一文本边界和所述第二文本对应的第二文本边界。


2.根据权利要求1所述的方法,其特征在于,所述基于所述融合特征图进行文本分类检测,获得用于区分所述第一文本和所述第二文本的文本分类特征图,包括:
基于所述融合特征图中的像素点进行文本分类检测,获得所述像素点对应于所述第一文本类型和所述第二文本类型的概率;
根据获得的所述概率,确定所述第一文本类型对应的第一像素点和所述第二文本类型对应的第二像素点;
根据所述第一像素点和所述第二像素点,获得所述文本分类特征图。


3.根据权利要求2所述的方法,其特征在于,
所述基于所述融合特征图中的像素点进行文本分类检测,获得所述像素点对应于所述第一文本类型和所述第二文本类型的概率,包括:基于所述融合特征图中的像素点进行文本分类检测,获得所述像素点对应于所述第一文本类型的概率、所述第二文本类型的概率、和文本背景的概率;
所述根据获得的所述概率,确定所述第一文本类型对应的第一像素点和所述第二文本类型对应的第二像素点,包括:根据获得的所述概率,确定所述第一文本类型对应的第一像素点、所述第二文本类型对应的第二像素点、和所述文本背景对应的第三像素点;
所述根据所述第一像素点和所述第二像素点,获得所述文本分类特征图,包括:根据所述第一像素点、所述第二像素点和所述第三像素点,获得所述文本分类特征图。


4.根据权利要求1所述的方法,其特征在于,所述对所述融合特征图进行文本边界检测,获得用于指示所述融合特征图中的文本边界的文本边界特征图,包括:
对所述融合特征图的像素点进行边界回归分析,获得用于指示所述融合特征图中的文本边界的文本边界特征图。


5.根据权利要求4所述的方法,其特征在于,所述对所述融合特征图的像素点进行边界回归分析,获得用于指示所述融合特征图中的文本边界的文本边界特征图,包括:
对所述融合特征图的像素点进行边界回归分析,获得所述像素点的边界距离和边界倾斜角度;
根据所述边界距离和所述边界倾斜角度,确定文本边界的中心点、宽度、高度和倾斜角度;
根据所述文本边界的中心点、宽度、高度和倾斜角度,获得文本边界特征图。


6.根据权利要求1所述的方法,其特征在于,所述将所述文本分类特征图和文本边界特征图进行匹配,获得所述第一文本对应的第一文本边界和所述第二文本对应的第二文本边界,包括:
将所述文本分类特征图中的像素点与所述文本边界特征图中的文本边界进行匹配,获得所述像素点对应的文本边界;
根据所述像素点对应的文本类型和所述像素点对应的文本边界,获得所述第一文本类型对应的第一文本的第一文本边界,和所述第二文本类型对应的第二文本的第二文本边界。


7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
分别对所述第一文本边界中的第一文本和所述第二文本边界中的第二文本进行内容识别,获得对应的第一文本内容和第二文本内容。


8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
以所述第一文本边界为基准,通过近邻匹配算法,获得与所述第一文本边界相匹配的第二文本边界;
根据所述第一文本边界...

【专利技术属性】
技术研发人员:张子浩李兵秦勇
申请(专利权)人:北京易真学思教育科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1