一种专家知识引导机制下的交通文本检测方法与系统技术方案

技术编号：30347769 阅读：24 留言：0更新日期：2021-10-16 16:40

本发明专利技术公开了一种专家知识引导机制下的交通文本检测方法与系统，属于交通文本识别领域，主要包括设计基于多任务深度学习与目标跟踪策略的文本检测方法；构建深度递归神经网络与多帧图像信息融合机制的文本识别方法；探索专家知识引导的语义联想机制的文本语义理解方法；各部分内容层层递进而又相互联系，以汽车辅助驾驶为应用背景，以交通文本为研究对象，探索一个有效的和具有严谨理论基础的解决方案来提高交通文本检测与识别性能。本发明专利技术的研究成果为汽车辅助驾驶相关研究与应用的深入开展提供依据，对文档分析与识别、计算机视觉的其他应用领域具有一定的借鉴意义。觉的其他应用领域具有一定的借鉴意义。觉的其他应用领域具有一定的借鉴意义。

全部详细技术资料下载

【技术实现步骤摘要】
一种专家知识引导机制下的交通文本检测方法与系统

[0001]本专利技术涉及交通文本识别领域，尤其涉及一种专家知识引导机制下的交通文本检测方法与系统。

技术介绍

[0002]汽车出现大大便利了人类的出行方式，但是随着社会发展与人口增加，汽车数量也呈现出爆发式增长，从而导致了交通拥堵、交通事故频发等一系列问题，进而给城市建设与人们生命财产安全带来危害。从汽车工业发展历程中我们可以看出，尽管汽车经过了一个世纪的发展，但汽车的行驶模式从未发生过本质的变化。在行驶过程中，驾驶员通过自身的视觉系统感知交通环境信息并对车辆行驶状态进行控制，从而形成一个“驾驶员
‑
车
‑
路
‑
环境”的闭环系统。在这个系统中，驾驶员是控制决策的核心。然而在车辆行进过程中，驾驶员会受到很多未知因素干扰，从而导致驾驶状态具有很大的不稳定性，这种以驾驶员为核心的传统车辆行驶方式在交通路况愈发复杂的情况下其缺点日益突出，同时也成为交通事故频发的主要原因。据统计，2017 年因为交通事故死亡人数达6.3万人，而且造成事故发生原因九成以上都是人为原因。如何有效地减少驾驶工作强度，避免驾驶员状态的不稳定性已成为提高驾驶安全和驾驶效率所急需解决的问题。
[0003]真实世界的环境复杂多样、道路情况不可穷尽，现代社会行车安全早已不仅是车与车之间的事情。机动车、非机动车、行人混杂的交通模式迫使驾驶员花费更多的精力来处理行车状况，在此情况下，一些常规的安全辅助系统略显疲态。为了减少交通事故的发生，人们提出将计算...

【技术保护点】

【技术特征摘要】
1.一种专家知识引导机制下的交通文本检测方法与系统，其特征在于，包括以下步骤：S1、根据交通标识牌检测以及文本检测任务的细粒度不同，分别构建相应的深度神经网络检测框架；S2、在上述框架中采用基于全卷积神经网络的方法从像素级分类的角度来获得目标候选区域，在此基础上通过应用FastR
‑
CNN获得目标候选区域的分类信息以及位置信息；并将交通标识牌检测处理进行区别处理；S3、在获得文本检测结果以及交通标识牌检测结果以后，为了剔除汽车行驶环境中的一些广告文本等非交通文本，在级联检测框架的后端综合利用了不同目标之间的位置信息、以及文本与交通标识牌的整体视觉信息，采用了基于视觉注意机制的深度神经网络进行判断，并将处理后所获得的交通文本区域进行非最大抑制处理(NMS)以获得准确的文本位置信息，与此同时还对视觉扭曲的文本进行对齐处理；S4、基于深度递归神经网络与多帧图像信息融合机制的对文本进行识别；S5、采用专家知识引导的语义联想机制对文本语义进行理解。2.根据权利要求1所述的一种专家知识引导机制下的交通文本检测方法与系统，其特征在于：所述S2中在实施文本检测过程中还增加了Maskbranch模块来分别获得文本行分割结果以及单独的文本分割结果。3.根据权利要求1所述的一种专家知识引导机制下的交通文本检测方法与系统，其特征在于：所述S3中的具体步骤如下：A1、假设第i帧图像为当前帧，第i
‑
1帧为上一帧以及第i+1帧为下一帧；首先采用基于多任务深度学习与级联检测方法对第i帧图像进行处理以获取交通文本候选区域，然后在级联检测框架的后端综合利用不同目标之间的位置信息、以及文本与交通标识牌的整体视觉信息，采用基于视觉注意机制的深度神经网络进行判断，剔除判决为伪交通文本的交通文本候选区域；A2、在A1的基础上，将获得的交通文本区域进行非最大抑制处理(NMS)以获得准确的文本位置信息，与此同时还对视觉扭曲的文本进行对齐处理；A3、将在第i
‑
1帧中所得到的交通文本目标作为跟踪目标，然后利用TLD跟踪算法在第i帧中对它进行预测，从而获取它在第i帧图像中的位置信息；在第i帧图像中，将检测结果与跟踪结果进行比较；如果出现新的交通文本目标，将它添加至当前的跟踪目标列表；反之，分别对已获得的检测结果与跟踪结果进行评判；如果检测结果较跟踪结果具有更高的识别置信度值，则将当前跟踪列表中该交通文本信息用其对应的检测结果予以替代，进而对当前跟踪列表进行更新；A4、融合第i帧中的交通文本检测结果与跟踪结果并构建新的跟踪列表，依据第i帧的跟踪列表，采用TLD跟踪算法在第i+1帧图像中对上述交通文本目标进行预测...

【专利技术属性】
技术研发人员：李秀梅，王润民，刘莹莹，胡彬，康瑞淳，钱盛友，代建华，
申请(专利权)人：湖南师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人