【技术实现步骤摘要】
文本内容的位置预测方法、装置、电子设备和存储介质
[0001]本专利技术涉及互联网
,特别是涉及一种文本内容的位置预测方法、装置、电子设备和计算机可读存储介质。
技术介绍
[0002]图像中文本内容的位置预测对于图像的理解具有重要的意义,是奠定图像分析的算法基石,因此,构建一种更加鲁棒的文本内容的位置预测方法对分析图像非常重要的。
[0003]目前,文本内容的位置预测方法主要分为两类,分别是基于回归的方法和基于分割的方法。
[0004](1)基于回归的方法。通过模型输出可旋转的文本区域候选框,并在边框回归计算过程中找到待回归的文本区域候选框的倾斜角度。例如,轮换区域候选网络(Rotation Region Proposal Network,简称RRPN)模型输出的文本区域候选框被表示为5元组,即x,y,h,w和θ。其中,x表示文本区域候选框的某一顶点的横坐标,y表示文本区域候选框的该一顶点的纵坐标,h表示文本区域候选框的高度,w表示文本区域候选框的宽度,θ表示文本区域候选框的倾斜角度。参照图1,图1示出 ...
【技术保护点】
【技术特征摘要】
1.一种文本内容的位置预测方法,其特征在于,所述方法包括:获取待处理的图像,所述图像包含至少一个条状的文本内容区域;从所述图像中提取出至少一个所述文本内容区域的第一语义特征,并根据所述第一语义特征和所述图像从所述图像中提取出至少一个所述文本内容区域的第二语义特征;分别对所述第二语义特征进行条形池化处理和特征加权处理,得到至少一个所述文本内容区域的位置信息。2.根据权利要求1所述的方法,其特征在于,所述从所述图像中提取出至少一个所述文本内容区域的第一语义特征,包括:从所述图像开始按照自底向上的方向进行多次卷积处理得到所述第一语义特征;其中,每次卷积处理的输入项为上一次卷积处理的输出项。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一语义特征和所述图像从所述图像中提取出至少一个所述文本内容区域的第二语义特征,包括:将所述第一语义特征进行卷积处理得到顶层卷积处理结果;从所述顶层卷积处理结果开始按照自顶向下的方向进行多次反卷积处理得到所述第二语义特征;其中,每次反卷积处理的输入项目为上一次反卷积处理的输出项和对应的每次卷积处理的输出项。4.根据权利要求1所述的方法,其特征在于,所述对所述第二语义特征进行条形池化处理,包括:对所述第二语义特征分别进行横向池化处理和纵向池化处理得到池化处理结果。5.根据权利要求4所述的方法,其特征在于,所述对所述第二语义特征进行特征加权处理,包括:对所述第二语义特征...
【专利技术属性】
技术研发人员:段晨,刘曦,张睿,魏晓林,
申请(专利权)人:北京三快在线科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。