【技术实现步骤摘要】
文本区确定方法、系统及相关装置
[0001]本申请实施例涉及信息处理
,尤其涉及文本区确定方法、系统及相关装置。
技术介绍
[0002]现如今,图像中的文本蕴含着丰富的信息,提取这些信息(即文本识别)对图像所处场景的理解等具有重要意义。
[0003]相应的,文本检测识别技术被广泛应用于教育、金融和医疗等领域,方便了行业的生产效率和人们的日常学习生活。其中,文本检测识别技术包括前期的文本检测(即定位文本位置)和后期的文本识别(即识别文本的内容),两者缺一不可,而文本检测作为文本识别的前提,尤为关键。
[0004]然而,现有的文本检测技术常单纯地仅使用预测算法直接预测文本的所在位置区域,使得受检文本完全依赖网络算法自身的检测性能去定位文本区域,造成容易将多方向排布的文本内容粘连至一个整体文本块区域输出,或将非文本内容(如标识logo、多余符号或装订痕迹点)误检成文本内容输出,进而出现文本检测效果不佳的影响。
技术实现思路
[0005]本申请实施例提供了文本区确定方法、系统及相关装置,用于提高 ...
【技术保护点】
【技术特征摘要】
1.一种文本区确定方法,其特征在于,包括:获取待测文本图像;通过目标预测模型对所述待测文本图像进行预测处理,得到所述待测文本图像中每个像素点属于文本区域的第一概率、以及每个像素点与相邻像素点属于同一类型的第二概率,属于同一类型是指被比对的两个像素点均属于文本区域或均属于非文本区域;根据所述待测文本图像中每个像素点的第一概率和第二概率进行概率分析处理,得到用于对文本区域与非文本区域进行分类的概率阈值;根据所述概率阈值对所述待测文本图像进行文本区域提取处理,得到所述待测文本图像中的文本区域。2.根据权利要求1所述的文本区确定方法,其特征在于,所述根据所述待测文本图像中每个像素点的第一概率和第二概率进行概率分析处理,得到用于对文本区域与非文本区域进行分类的概率阈值,包括:对所述待测文本图像中每个像素点的第一概率和第二概率进行组合处理,得到每个像素点对应的第一kernel;对多个第一kernel进行聚类处理,得到聚类中心kernel;根据所述聚类中心kernel,确定用于对文本区域与非文本区域进行分类的概率阈值。3.根据权利要求2所述的文本区确定方法,其特征在于,所述聚类中心kernel包括对应表示文本区域类型的第一聚类中心kernel_1、及对应表示非文本区域类型的第二聚类中心kernel_2;所述根据所述聚类中心kernel,确定用于对文本区域与非文本区域进行分类的概率阈值,包括:根据所述kernel_1、所述kernel_2和多个像素点的第一概率之间的最值关系,计算用于对文本区域与非文本区域进行分类的概率阈值。4.根据权利要求2所述的文本区确定方法,其特征在于,所述根据所述概率阈值对所述待测文本图像进行文本区域提取处理,得到所述待测文本图像中的文本区域,包括:对所述待测文本图像中每个像素点的第一概率和周围像素点的第一概率进行组合处理,得到每个像素点对应的第二kernel;对所述待测文本图像中每个像素点的第一kernel及第二kernel进行卷积处理得到卷积值;根据所述概率阈值对掩膜结果图进行二值化处理;其中,所述掩膜结果图包括所述待测文本图像中每个像素点的卷积值;对二值化处理后的所述掩膜结果图进行轮廓提取处理,将提取到的区域作为所述待测文本图像中的文本区域。5.根据权利要求1至4任一项所述的文本区确定方法,其特征在于,所述文本区域的数量包括多个;所述根据所述概率阈值对所述待测文本图像进行文本区域提取处理,得到所述待测文本图像中的文本区域之后,所述方法还包括:确定所述文本区域对应的多种数据信息;对所述多种数据信息进行特征融合处理,得到所述文本区域对应的特征结果;滤除所述特征结果未达到特征评选阈值的文本区域。
6.根据权利要求5所述的文本区确定方法,其特征在于,所述确定所述文本区域对应的多种数据信息,包括:分别截取所述文本区域在所述待测文本图像和像素掩膜图...
【专利技术属性】
技术研发人员:许康,宁可,
申请(专利权)人:金蝶软件中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。