文本内容的位置预测方法、装置、电子设备和存储介质制造方法及图纸

技术编号:33285205 阅读:28 留言:0更新日期:2022-04-30 23:50
本发明专利技术实施例提供了一种文本内容的位置预测方法和装置,其中,所述方法包括:获取包含条状的文本内容区域的图像;提取出文本内容区域的第一语义特征,根据第一语义特征提取出文本内容区域的第二语义特征;分别对第二语义特征进行条形池化处理和特征加权处理得到文本内容区域的位置信息。本发明专利技术实施例对第一语义特征进行二次提取得到第二语义特征,可以获取更加细化的边缘信息,提升了语义分割结果,进而提高文本内容的位置预测的准确度。对第二语义特征进行条形池化处理,捕获空间区域的长依赖关系,防止无关区域的干扰。对第二语义特征进行特征加权处理,增强文本内容的特征,同时聚合全局和局部的上下文信息,增强长文本内容的位置预测能力。的位置预测能力。的位置预测能力。

【技术实现步骤摘要】
文本内容的位置预测方法、装置、电子设备和存储介质


[0001]本专利技术涉及互联网
,特别是涉及一种文本内容的位置预测方法、装置、电子设备和计算机可读存储介质。

技术介绍

[0002]图像中文本内容的位置预测对于图像的理解具有重要的意义,是奠定图像分析的算法基石,因此,构建一种更加鲁棒的文本内容的位置预测方法对分析图像非常重要的。
[0003]目前,文本内容的位置预测方法主要分为两类,分别是基于回归的方法和基于分割的方法。
[0004](1)基于回归的方法。通过模型输出可旋转的文本区域候选框,并在边框回归计算过程中找到待回归的文本区域候选框的倾斜角度。例如,轮换区域候选网络(Rotation Region Proposal Network,简称RRPN)模型输出的文本区域候选框被表示为5元组,即x,y,h,w和θ。其中,x表示文本区域候选框的某一顶点的横坐标,y表示文本区域候选框的该一顶点的纵坐标,h表示文本区域候选框的高度,w表示文本区域候选框的宽度,θ表示文本区域候选框的倾斜角度。参照图1,图1示出了RRPN模型的输出本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本内容的位置预测方法,其特征在于,所述方法包括:获取待处理的图像,所述图像包含至少一个条状的文本内容区域;从所述图像中提取出至少一个所述文本内容区域的第一语义特征,并根据所述第一语义特征和所述图像从所述图像中提取出至少一个所述文本内容区域的第二语义特征;分别对所述第二语义特征进行条形池化处理和特征加权处理,得到至少一个所述文本内容区域的位置信息。2.根据权利要求1所述的方法,其特征在于,所述从所述图像中提取出至少一个所述文本内容区域的第一语义特征,包括:从所述图像开始按照自底向上的方向进行多次卷积处理得到所述第一语义特征;其中,每次卷积处理的输入项为上一次卷积处理的输出项。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一语义特征和所述图像从所述图像中提取出至少一个所述文本内容区域的第二语义特征,包括:将所述第一语义特征进行卷积处理得到顶层卷积处理结果;从所述顶层卷积处理结果开始按照自顶向下的方向进行多次反卷积处理得到所述第二语义特征;其中,每次反卷积处理的输入项目为上一次反卷积处理的输出项和对应的每次卷积处理的输出项。4.根据权利要求1所述的方法,其特征在于,所述对所述第二语义特征进行条形池化处理,包括:对所述第二语义特征分别进行横向池化处理和纵向池化处理得到池化处理结果。5.根据权利要求4所述的方法,其特征在于,所述对所述第二语义特征进行特征加权处理,包括:对所述第二语义特征...

【专利技术属性】
技术研发人员:段晨刘曦张睿魏晓林
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1