一种道路缺陷识别模型训练用数据集获取方法技术

技术编号:38997462 阅读:12 留言:0更新日期:2023-10-07 10:28
本发明专利技术公开了一种道路缺陷识别模型训练用数据集获取方法,涉及道路工程领域,包括采集历史图像数据,进行图像分割以形成缺陷单元图像,并对其进行聚类,形成基础道路缺陷的第一数据集;然后,根据预设规则将基础缺陷组合,形成组合道路缺陷,并将其与历史图像比对,根据相似度大小,将其纳入第二或第三数据集。在训练模型时,首先使用第一数据集进行训练,然后基于前一数据集的训练结果,采用迁移学习方式使用第二和第三数据集进行进一步训练。本发明专利技术方法提高了识别的准确性和模型的泛化能力,能有效识别各种未出现过的道路缺陷。能有效识别各种未出现过的道路缺陷。能有效识别各种未出现过的道路缺陷。

【技术实现步骤摘要】
一种道路缺陷识别模型训练用数据集获取方法


[0001]本专利技术涉及道路工程领域,更具体地说,涉及一种道路缺陷识别模型训练用数据集获取方法。

技术介绍

[0002]随着城市化进程的加快,城市道路的维护和管理工作日益重要。特别是道路表面的缺陷识别与修复,关系到道路的使用寿命、行车的安全以及城市的运行效率。然而,现有的道路缺陷识别技术多存在一些问题,未能满足日益严格的道路管理需求。
[0003]现有的道路缺陷识别技术主要依赖于图像识别技术,通过对道路表面的实时图像进行识别分析,以检测道路表面的缺陷。这些技术一般使用摄像头捕捉道路表面的实时图像,然后利用图像识别算法对图像进行分析,以识别出道路表面的缺陷。
[0004]这些方法的基础是从大量道路图像中训练模型,以识别出各种道路缺陷。然而,这类方法的一个重要限制在于,训练模型的效果大程度上依赖于所使用的图像数据库的质量和多样性。
[0005]现有的道路图像数据库通常由采集的历史道路图像组成,这些图像中包含了各种已经出现过的道路缺陷。然而,由于道路缺陷的种类和形态千变万化,这些历史图像不可能包含所有可能出现的道路缺陷,特别是一些尚未出现过的新型或复杂缺陷。因此,基于这类图像数据库训练出的模型可能无法准确识别那些在训练数据集中未曾出现过的道路缺陷,这大大限制了现有道路缺陷识别技术的实用性和可靠性。
[0006]此外,现有的道路缺陷识别技术也往往忽视了道路缺陷之间的复杂关系。例如,多种不同类型的道路缺陷可能在同一位置或相邻位置并存,形成复杂的组合缺陷,这对识别模型的性能和鲁棒性提出了更高的要求。

技术实现思路

[0007]本专利技术要解决的技术问题是提供一种道路缺陷识别模型训练用数据集获取方法,以解决
技术介绍
中提到的问题。
[0008]为了达到上述目的,本专利技术采取以下技术方案:
[0009]一种道路缺陷识别模型训练用数据集获取方法,包括如下步骤:
[0010]S1:采集包含各种道路缺陷的历史图像数据;
[0011]S2:对于历史缺陷图像,采用图像分割技术,以轮廓和边缘为基础,将各个缺陷从背景和其他相邻缺陷中分割出来,得到一系列缺陷单元图像;
[0012]S3:对于分割后的缺陷单元图像,采用图像聚类算法,基于图像的形状、尺寸特征,对缺陷单元图像进行聚类,使得形状、尺寸相似的缺陷单元图像在同一类中,每一类代表一种基础道路缺陷;将基础道路缺陷纳入第一数据集;
[0013]S4:根据预定的规则和算法,随机选取多个基础道路缺陷,以及各个基础道路缺陷的位置、重叠等级参数,将这些基础道路缺陷进行组合,得到一系列组合道路缺陷;
[0014]S5:将每一个组合道路缺陷的图像与S1中的历史图像数据中的所有图像进行比对,根据比对结果,如果历史图像数据中存在图像与该组合道路缺陷的图像的相似度小于预设的阈值,则将该组合道路缺陷图像纳入第二数据集,否则,将该组合道路缺陷图像纳入第三数据集;
[0015]S6:在训练道路缺陷识别模型时,首先采用第一数据集对模型进行训练,随后,在基于第一数据集的训练结果基础上,采用迁移学习的方式使用第二数据集进行进一步训练;接着,在基于第二数据集的训练结果基础上,采用迁移学习的方式使用第三数据集进行进一步训练。
[0016]在一些实施例中,所述图像分割技术采用全卷积网络或U

Net模型。
[0017]在一些实施例中,所述图像聚类算法采用K

Means聚类算法或谱聚类算法。
[0018]在一些实施例中,S4中所述预定的规则和算法包括:
[0019]基础道路缺陷选择规则:定义从基础道路缺陷库中选择多少个基础道路缺陷进行组合的规则;这可以是固定的数字,也可以是一个范围内的随机数字。例如,可以定义每次组合选择2

4个元缺陷;
[0020]基础道路缺陷位置规则:定义基础道路缺陷在组合中的位置关系;这可以包括基础道路缺陷在水平方向上的相对位置(如左、右或随机)、基础道路缺陷在垂直方向上的相对位置(如上、下或随机)等。例如,可以定义基础道路缺陷在水平和垂直方向上的位置是随机的。
[0021]基础道路缺陷重叠等级参数:定义基础道路缺陷在组合中可以重叠的程度;可以设定为一个范围,例如0

50%,其中0表示没有重叠,50%表示一个基础道路缺陷可以覆盖另一个基础道路缺陷的一半面积。
[0022]组合算法:用于根据上述规则来实际生成组合道路缺陷。即算法需要根据基础道路缺陷选择规则随机选择基础道路缺陷,然后根据基础道路缺陷位置规则和基础道路缺陷重叠等级参数来确定基础道路缺陷在组合中的具体位置和重叠程度。
[0023]在一些实施例中,S5中的相似度计算基于如下步骤:使用形状上下文(Shape Context)或者四叉树(Quadtree)来提取图像的形状特征,然后使用距离度量来计算这些特征之间的相似度。
[0024]在一些实施例中,所述距离度量为欧氏距离或者余弦相似度。
[0025]在一些实施例中,所述道路缺陷识别模型在任一数据集上的训练过程包括:
[0026]S621:人为在实验所用地面上构造数据集上的道路缺陷;
[0027]S622:使用一辆装备有各类传感器的汽车,对S621的道路缺陷驶过,记录传感器数据并标注对应的缺陷类型,形成特征数据集;
[0028]S623:应用机器学习算法,利用S622步骤得到的特征数据集训练一个道路缺陷识别模型,所述道路缺陷识别模型用于接收汽车行驶过程中传感器的实时数据并输出对应的道路缺陷类型。
[0029]在一些实施例中,S622中所述传感器至少包括加速度传感器和陀螺仪。
[0030]本专利技术相对于现有技术的优点在于:
[0031]1、本专利技术通过采用三种数据集分类的方法,将基础道路缺陷、组合道路缺陷以及在历史图像数据中已经出现过的组合道路缺陷进行了有效的整理和分类。这不仅可以增加
训练数据集的多样性,同时也有利于模型学习和理解不同类型的道路缺陷,从而提高模型的识别准确性。
[0032]2、本专利技术通过生成和训练包含未在历史图像数据中出现过的组合道路缺陷的数据集,该方法可以让模型具有识别未知道路缺陷的能力。这对于提升模型的泛化性能和实用性非常重要,因为在实际应用中,总会存在一些新的、未曾出现过的道路缺陷需要模型识别和处理。
[0033]3、本专利技术通过采用迁移学习的方式,首先使用第一数据集(基础道路缺陷)进行模型的初步训练,让模型掌握最基础的道路缺陷的识别能力。然后在第一数据集训练的基础上,通过迁移学习使用第二数据集(组合道路缺陷)进行进一步训练,让模型理解和掌握更复杂的、由基础缺陷组合而成的缺陷的识别能力。在每一步的迁移学习中,模型都可以利用上一步训练的结果,避免了从头开始训练的复杂度。第三数据集包含了那些在历史图像数据中出现过,但在第一、第二数据集中没有的组合道路缺陷。通过在第二本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种道路缺陷识别模型训练用数据集获取方法,其特征在于,包括如下步骤:S1:采集包含各种道路缺陷的历史图像数据;S2:对于历史缺陷图像,采用图像分割技术,以轮廓和边缘为基础,将各个缺陷从背景和其他相邻缺陷中分割出来,得到一系列缺陷单元图像;S3:对于分割后的缺陷单元图像,采用图像聚类算法,基于图像的形状、尺寸特征,对缺陷单元图像进行聚类,使得形状、尺寸相似的缺陷单元图像在同一类中,每一类代表一种基础道路缺陷;将基础道路缺陷纳入第一数据集;S4:根据预定的规则和算法,随机选取多个基础道路缺陷,以及各个基础道路缺陷的位置、重叠等级参数,将这些基础道路缺陷进行组合,得到一系列组合道路缺陷;S5:将每一个组合道路缺陷的图像与S1中的历史图像数据中的所有图像进行比对,根据比对结果,如果历史图像数据中存在图像与该组合道路缺陷的图像的相似度小于预设的阈值,则将该组合道路缺陷图像纳入第二数据集,否则,将该组合道路缺陷图像纳入第三数据集;S6:在训练道路缺陷识别模型时,首先采用第一数据集对模型进行训练,随后,在基于第一数据集的训练结果基础上,采用迁移学习的方式使用第二数据集进行进一步训练;接着,在基于第二数据集的训练结果基础上,采用迁移学习的方式使用第三数据集进行进一步训练。2.根据权利要求1所述道路缺陷识别模型训练用数据集获取方法,其特征在于,所述图像分割技术采用全卷积网络或U

Net模型。3.根据权利要求1所述道路缺陷识别模型训练用数据集获取方法,其特征在于,所述图像聚类算法采用K
...

【专利技术属性】
技术研发人员:刘君李静林邹思思李永
申请(专利权)人:新唐信通北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1