【技术实现步骤摘要】
倾斜文本方向分类方法、装置、终端设备和可读存储介质
[0001]本申请涉及文本图像处理
,尤其涉及一种倾斜文本方向分类方法、装置、终端设备和可读存储介质。
技术介绍
[0002]随着智能手机、人工智能、深度学习等领域的快速发展,图像文字识别OCR技术近年来得到广泛应用。人们使用手机拍摄各类包含文字的图像,如单证、票据、文档、试题、自然场景等,利用OCR技术从图像中识别出文字,快捷获取需要的信息。人们用手机拍摄图像具有一定随意性和不规范性,导致图像中文字倾斜的可能性很大,同时图像可能存在方向旋转,进一步影响了图像文字的方向。无论基于传统图像算法还是基于深度学习的文字识别技术都需要获取到正向的文字再进行识别,因此图像文字方向判断或分类是文字识别中重要一环。
[0003]现有图像文字方向分类方法通常需要独立的功能模块来支持,以基于深度学习路线的方法为例,即使用独立的文字方向分类模型来单独处理。由于作为独立的功能模块,应用部署时需要额外增加一个环节,计算开销和资源开销更大。
技术实现思路
[0004]本申请实施例提供一种倾斜文本方向分类方法、装置、终端设备和可读存储介质,该方法避免了将文本方向判定作为独立功能模块实现,节省了方向分类任务相关的模型参数开销、训练开销、预测开销及后续计算开销等。
[0005]第一方面,本申请实施例提供了一种倾斜文本方向分类方法,包括:
[0006]将待检测图片输入已训练的倾斜文本检测模型,预测输出所述图片中文本所在区域的文本包围框信息,所述文本包围框 ...
【技术保护点】
【技术特征摘要】
1.一种倾斜文本方向分类方法,其特征在于,包括:将待检测图片输入已训练的倾斜文本检测模型,预测输出所述图片中文本所在区域的文本包围框信息,所述文本包围框信息包括用于包围相应文本串的旋转矩形的两个顶点坐标;选取预设比例数量的文本包围框,并根据所述旋转矩形的两个顶点的坐标按照包围框方向分类算法分别计算所述选取的各个文本包围框的文本方向分类结果;根据各个所述文本方向分类结果确定所述图片的最终文本方向分类。2.根据权利要求1所述的倾斜文本方向分类方法,其特征在于,所述旋转矩形的两个顶点记为第一顶点和第二顶点,其中,所述第一顶点和所述第二顶点分别定义为所述旋转矩形在被包围文本处于转正状态下的左上顶点和右上顶点;所述根据所述旋转矩形的两个顶点的坐标按照包围框方向分类算法分别计算所述选取的各个文本包围框的文本方向分类结果,包括:利用所述旋转矩形的第一顶点和第二顶点的坐标计算所述旋转矩形的倾斜角度;根据预先定义的多个预设方向及各自对应的指定角度区间,确定所述倾斜角度所在的角度区间,将所述倾斜角度所在的角度区间所对应的预设方向作为所述旋转矩形的方向分类结果。3.根据权利要求2所述的倾斜文本方向分类方法,其特征在于,所述利用所述旋转矩形的第一顶点和第二顶点的坐标计算所述旋转矩形的倾斜角度,包括:根据所述旋转矩形的第一顶点和第二顶点的坐标按照斜率公式计算得到一个斜率值;根据所述旋转矩形的第一顶点和第二顶点的横坐标的大小比较结果、及所述第一顶点和第二顶点的纵坐标的大小比较结果,选取对应的角度计算公式;根据所述斜率值和所述选取的角度计算公式,计算得到所述旋转矩形的倾斜角度。4.根据权利要求3所述的倾斜文本方向分类方法,其特征在于,所述根据所述旋转矩形的第一顶点和第二顶点的横坐标的大小比较结果、及所述第一顶点和第二顶点的纵坐标的大小比较结果,选取对应的角度计算公式,包括:当所述第一顶点的横坐标小于所述第二顶点的横坐标,则选取第一角度计算公式,所述第一角度计算公式为:θ=arctan(K)*180/π;其中,θ为所述旋转矩形的倾斜角度;K为斜率值;当所述第一顶点的横坐标大于所述第二顶点的横坐标,且所述第一顶点的纵坐标小于等于所述第二顶点的纵坐标,则选取第二角度计算公式,所述第二角度计算公式为:θ=180
°
+arctan(K)*180/π;当所述第一顶点的横坐标大于所述第二顶点的横坐标,且所述第一顶点的纵坐标大于所述第二顶点的纵坐标,则选取第三角度计算公式,所述第三角度计算公式为:θ=
‑
180
°
+arctan(K)*180/π。5.根据权利要求2所述的倾斜文本方向分类方法,其特征在于,...
【专利技术属性】
技术研发人员:田强,张瑞楠,李树凯,杜新凯,
申请(专利权)人:阳光保险集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。