【技术实现步骤摘要】
一种文本检测方法、装置、设备及存储介质
[0001]本专利技术实施例涉及文本检测
,尤其涉及一种文本检测方法、装置、设备及存储介质。
技术介绍
[0002]随着人工智能技术的快速发展,人工神经网络被越来越多的应用在各个领域中,例如文字检测、车辆检测,人物检测等,但是图像中的文字、车辆等目标存在非水平的情况,需要进行旋转目标检测。在旋转目标检测场景中,使用水平框检测器的检测结果往往会携带有冗余的背景信息,为了改善水平框检测器对旋转目标检测的能力,学术界与工业界对旋转目标检测器的研究愈来愈多。在旋转目标检测器训练优化中,由于传统的水平锚框需要改进成旋转锚框,才能满足旋转目标检测器的要求,然而这种改进却给训练带来如下问题:
[0003]第一、更加复杂的计算交并比的逻辑。旋转矩形框相较于与水平矩形框会产生复杂的正负样本匹配计算逻辑,主要是求解旋转矩形框之间的交并集的复杂度最高。第二、要平衡生成高质量的旋转锚框与正负样本匹配计算量的关系。众所周知,旋转检测器的旋转锚框通常将角度从[0,180]或者[0,90]以及其他范围 ...
【技术保护点】
【技术特征摘要】
1.一种文本检测方法,其特征在于,包括:获取待检测图片;将所述待检测图片输入到预确定的目标文本检测模型中,所述目标文本检测模型的损失函数根据正样本确定,所述正样本根据角度确定;根据所述目标文本检测模型的输出结果对所述待检测图片中的文本进行检测,获得所述文本所对应的目标文本框。2.根据权利要求1所述的方法,其特征在于,所述目标文本检测模型的训练步骤包括:获取包括至少一个训练样本的训练样本集,所述训练样本中包括标准检测框的标准框信息,所述标准框信息包括标准中心点坐标、标准长度、标准宽度和标准角度;将当前迭代下对应的训练样本输入至当前的待训练文本检测模型中,所述待训练文本检测模型根据当前迭代下的训练样本生成至少一个旋转锚框,所述旋转锚框的旋转框信息包括旋转中心点坐标、旋转长度、旋转宽度和旋转角度;根据当前迭代下的训练样本的标准角度对各所述旋转锚框进行筛选,得到至少一个待匹配锚框;根据各所述待匹配锚框确定正样本;基于给定的损失函数表达式,结合所述正样本的旋转框信息结合标准框信息确定损失函数;基于所述损失函数对所述待训练文本检测模型进行反向传播,得到用于下一迭代的待训练文本检测模型,直至满足迭代收敛条件,得到目标文本检测模型。3.根据权利要求2所述的方法,其特征在于,所述待训练文本检测模型根据当前迭代下的训练样本生成至少一个旋转锚框,包括:获取预先确定的锚框信息集合,所述锚框信息集合包括预设数量的锚框信息,所述锚框信息包括长度、宽度和角度;将当前迭代下的训练样本的标准中心点坐标作为中心点,按照各所述锚框信息生成各所述锚框信息对应的旋转锚框。4.根据权利要求2所述的方法,其特征在于,所述根据当前迭代下的训练样本的标准角度对各所述旋转锚框进行筛选,得到至少一个待匹配锚框,包括:确定训练样本的标...
【专利技术属性】
技术研发人员:周源赣,章水鑫,
申请(专利权)人:南京三百云信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。