【技术实现步骤摘要】
一种交通文本检测方法、装置、设备及介质
[0001]本专利技术涉及人工智能
,特别涉及一种交通文本检测方法、装置、设备及介质。
技术介绍
[0002]目前,交通文本检测多用于无人驾驶系统的视觉感知环节,环境中的大量噪声会影响无人驾驶系统对目标检测物体的判断,从而影响系统对无人驾驶车辆的控制。此外,交通文本包含了不同的语种,就我国来看,每一块交通文本上都包括中文和英文(包含拼音在内),而这两个语种包含着数量规模不等的文字类型,每一块交通文本上都存在着不同语种或者相同语种的不同文本类型之间视觉特征上的巨大差异,并且图像中还可能会包含一些复杂的环境因素影响。因此,对交通文本进行精细定位是本领域需要解决的问题。
[0003]虽然目前已经出现了许多行之有效的方法,但是对于交通文本的检测仍然有待研究,并且高速发展的无人驾驶行业使得交通文本检测技术更加需要与时俱进。首先,由于交通文本的大尺度变化特性,如果只考虑单一方向的图像特征,基于边界框回归的检测器的检测准确度会大大降低。其次,目前交通文本检测的上采样技术中大多选择双线性 ...
【技术保护点】
【技术特征摘要】
1.一种交通文本检测方法,其特征在于,包括:利用低光照图像增强算法对采集到的原始图像进行图像增强处理,得到目标图像,并利用ResNet50网络对所述目标图像进行特征提取,然后基于注意力机制对提取后得到的特征图进行特征增强运算,得到增强后特征图;通过二维Lanczos插值算法对所述增强后特征图进行上采样处理,并基于预设的水平卷积核与垂直卷积核对上采样后得到的特征图进行特征提取,然后对提取后得到的水平特征图以及垂直特征图进行特征融合;基于预设的可变区域候选网络以及预设的不同宽高比的锚定框对融合后得到的特征图进行处理,得到目标提议框;利用可变形感兴趣区域池化对所述目标提议框进行池化处理,并将相应的处理结果输入至全连接层进行回归处理,得到回归后提议框以及相应的分类结果,所述分类结果用于表示所述目标图像中的文本是否为目标交通文本;通过CBAM模块提取所述回归后提议框的通道注意力特征图以及空间注意力特征图,并对提取后得到的特征图进行非极大值抑制运算以得到目标预测框;其中,所述目标预测框用来预测所述目标交通文本在所述目标图像上的区域位置。2.根据权利要求1所述的交通文本检测方法,其特征在于,所述利用低光照图像增强算法对采集到的原始图像进行图像增强处理,得到目标图像,包括:利用LIME算法对采集到的原始图像进行图像增强处理,得到目标图像。3.根据权利要求1所述的交通文本检测方法,其特征在于,所述基于注意力机制对提取后得到的特征图进行特征增强运算,得到增强后特征图,包括:基于注意力机制对提取后得到的特征图进行处理,得到第一特征图;将所述第一特征图与所述提取后得到的特征图做乘积运算,得到第二特征图;将所述第二特征图与所述提取后得到的特征图进行特征融合,得到增强后特征图。4.根据权利要求1至3任一项所述的交通文本检测方法,其特征在于,所述基于预设的可变区域候选网络以及预设的不同宽高比的锚定框对融合后得到的特征图进行处理,得到目标提议框,包括:将提取后得到的水平特征图以及垂直特征图进行特征融合后得到的特征图划分为不同子区域,并为每个所述子区域设置预设的不同宽高比的锚定框;基于预设的可变区域候选网络,并基于设置有所述锚定框的所述融合后得到的特征图确定出目标提议框。5.根据权利要求4所述的交通文本检测方法,其特征在于,所述基于预设的可变区域候选网络,并基于设置有所述锚定框的所述融合后得到的特征图确定出目标提议框,包括:利用所述预设的可变区域候选网络中的可变形卷积单元,对所述设置有所述锚定框的所述融合后得到的特征图进行可变形卷积运算,得到第一运算结果;通过双线性插值算法对所述...
【专利技术属性】
技术研发人员:王润民,康瑞淳,朱彦斌,陈华,朱祯琳,朱桂林,刘莹莹,刘明昊,徐尉翔,张翔宇,丁亚军,钱盛友,代建华,
申请(专利权)人:湖南师范大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。