基于视频帧聚类的管网缺陷智能识别方法及装置、介质制造方法及图纸

技术编号:33896730 阅读:18 留言:0更新日期:2022-06-22 17:33
基于视频帧聚类的管网缺陷智能识别方法及装置、介质,所述方法包括:提取视频数据中每个视频帧特征值,并生成特征值集;输入视频帧特征值集并预设阈值,划分为第一个类别并将视频帧特征集中的第一个视频帧特征值划分为第一类质心,并将之后每个视频帧特征值有序的与已有i类别的质心计算欧式距离并与预设阈值比较进而将它归属于已有i类别中的某一类或者划分为新的第i+1个类别并将它划分为新类别的质心;选择每个类别中距离对应质心最近的视频帧特征值作为关键帧特征值。本发明专利技术不仅提高了管网缺陷自动化检测效率以及准确性,还减少了工作人员劳动强度,在管网视频缺陷检测中具有巨大的推广应用价值。大的推广应用价值。大的推广应用价值。

【技术实现步骤摘要】
基于视频帧聚类的管网缺陷智能识别方法及装置、介质


[0001]本专利技术涉及管网缺陷智能检测
,具体为涉及一种基于视频帧聚类的管网缺陷智能识别方法及装置、介质。

技术介绍

[0002]地下排水管网是城市排水的重要组成部分,随着地下排水管网使用年限的增加,排水管道将逐渐出现变形、破损、腐蚀、断裂、渗漏等缺陷,导致管道爆裂、内涝、路面坍陷等重大危害,造成极大经济损失和人身危害。
[0003]目前的地下管网检测主要为人工检测和管道闭路电视系统(Closed Circuit Television Inspection,CCTV)机器人检测。两类检测方法的差别在于视频数据获取方法不同,人工检测由人工获取视频数据,CCTV机器人检测由机器人摄像头获取视频数据。两类方法采集到的视频数据都由人工进行判读,然后进行管道缺陷评估,并生成行业检测报告。这两类方法在管道缺陷检测阶段必须依靠经验丰富的作业人员进行判断,而业内作业人员水平参差不齐、流动性强,对行业规程和标准掌握不足。此外,这两类方法需要工作人员到实地对设备与环境进行检查,耗时长、人员需求量大、效率低、准确性差。因此,现有管网缺陷检测方法具有较大局限性,存在很大改进空间。

技术实现思路

[0004]本专利技术提供了一种基于视频帧聚类的管网缺陷智能识别方法及装置,能够提高管网缺陷检测效率,以及提升管网缺陷检测准确率。
[0005]本专利技术的具体技术方案如下:根据本专利技术的第一技术方案,提供一种基于视频帧聚类管网缺陷智能识别方法,所述方法包括:提取视频数据中各视频帧特征值,生成视频帧特征值集X={x1…ꢀ
x
k

x
n
}, 并预先设定阈值;划分第一个类别并将视频帧特征集中的第一个视频帧特征值划分为第一类质心,并将之后的每个视频帧特征值有序的与已有i(1≤i≤n)类别的质心计算欧式距离并与预设阈值比较进而将它归属于已有i类别中的某一类或者划分新的第i+1个类别并将它划分为新的类别的质心;选择每个类别中距离对应质心最近的视频帧作为关键帧,如果某一类存在多个与质心距离最近的视频帧特征值时,将这些视频帧特征值取算术平均作为该类的关键帧特征值。
[0006]根据本专利技术的第二技术方案,提供一种基于视频帧聚类管网缺陷智能识别装置,所述装置包括计算单元,所述计算单元配置为:提取视频数据中各视频帧特征值,生成视频帧特征值集X={x1…
x
k

x
n
}, 并预先设定阈值;确定第一个类别并将视频帧特征集中的第一个视频帧特征值划分为第一类质心,并将之后的每个视频帧特征值有序的与已有i (1≤i≤n)类别的质心计算欧式距离并与预设阈值比较进而将它归属于已有i类别中的某一类或者划分新的第i+1个类别并将它划分
为新的类别的质心。具体为计算第k个视频帧特征值与第j(1≤j≤i)类质心的欧式距离,若该欧式距离值小于预设阈值时,则将该视频帧特征值归入到第j类中并对第j类中所有视频帧特征值取算术平均以更新第j类质心,若该欧式距离值大于等于预先设定的阈值且j不等于i时,则计算第k个视频帧特征值与第j+1类质心的欧式距离并再次与预设阈值进行比较,若计算的欧式距离大于等于预先设定的第j类阈值且j等于i时,则划分第i+1个类别并将该视频帧特征值划分为第i+1类质心;选择每个类别中距离对应质心最近的视频帧特征值作为关键帧特征值,如果某一类存在多个与质心距离最近的视频帧特征值时,将这些视频帧特征值取算术平均作为该类的关键帧特征值。
[0007]根据本专利技术的第三技术方案,提供一种计算机可读存储介质,其上存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时,使计算机执行本专利技术任一实施例所述的方法。
[0008]根据本专利技术每个实施例公开的一种基于视频帧聚类的管网缺陷智能识别方法及装置、介质,不仅可以提高管网缺陷自动化检测效率以及准确性,而且可以减少工作人员的劳动强度,在管网视频缺陷检测中具有巨大的推广应用价值。
附图说明
[0009]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
[0010]图1示出了根据本专利技术实施例的一种基于视频帧聚类的管网缺陷智能识别方法的流程图。
[0011]图2示出了根据本专利技术实施例的视频帧聚类方法的流程图。
[0012]图3示出了根据本专利技术实施例的一种基于视频帧聚类的管网缺陷智能识别方法的聚类结果图。
[0013]图4示出了根据本专利技术实施例的AlexNet网络模型的网络结构图。
[0014]图5示出了根据本专利技术实施例的一种分类器的示意图。
具体实施方式
[0015]下面将对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0016]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步的详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定专利技术。
[0017]现在结合说明书附图对本专利技术做进一步的说明。
[0018]图1示出了根据本专利技术实施例的一种基于视频帧聚类的管网缺陷智能识别方法的流程图。本专利技术实施例提供一种基于视频帧聚类的管网缺陷智能识别方法,如图1所示,该
方法始于步骤S100,提取视频数据中各视频帧特征值,生成视频帧特征值集X={x1…
x
k

x
n
}, 并预先设定阈值。
[0019]在步骤S200,确定第一个类别并将视频帧特征值集中的第一个视频帧特征值划分为第一类质心,并将之后每个视频帧特征值有序的与已有i(1≤i≤n)类别的质心计算欧式距离并与预设阈值比较进而将它归属于已有i类别中的某一类或者划分为新的第i+1个类别并将它划分为新类别的质心。
[0020]其中,步骤S200具体实现为:计算第k个视频帧特征值与第j(1≤j≤i)类质心的欧式距离,若该欧式距离值小于预设阈值时,则将该视频帧特征值归入到第j类中并对第j类中所有视频帧特征值取算术平均以更新第j类质心,若该欧式距离值大于等于预先设定的阈值且j不等于i时,则计算第k个视频帧特征值与第j+1类质心的欧式距离并再次与预设阈值进行比较,若计算的欧式距离大于等于预先设定的第j类阈值且j等于i时,则划分第i+1个类别并将该视频帧特征值划分为第i+1类质心。将第k个视频帧特征值循环上述过程直到属于已有i类别中的某一类或产生一个新的类别并将该视频特征值作为新的一类的质心。以此类推,将视频帧特征值集X中每一个特征值进行如上处理,可本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于视频帧聚类的管网缺陷智能识别方法,其特征在于,所述方法包括:提取视频数据中各视频帧特征值,生成视频帧特征值集X={x1…
x
k

x
n
}, 并预先设定阈值;确定第一个类别并将视频帧特征值集中的第一个视频帧特征值划分为第一类质心,并将之后每个视频帧特征值有序的与已有i类别的质心计算欧式距离并与预设阈值比较进而将它归属于已有i类别中的某一类或者划分为新的第i+1个类别并将它划分为新类别的质心:计算第k个视频帧特征值与第j类质心的欧式距离,若该欧式距离值小于预设阈值时,则将该视频帧特征值归入到第j类中并对第j类中所有视频帧特征值取算术平均以更新第j类质心,若该欧式距离值大于等于预先设定的阈值且j不等于i时,则计算第k个视频帧特征值与第j+1类质心的欧式距离并再次与预设阈值进行比较,若计算的欧式距离大于等于预先设定的第j类阈值且j等于i时,则划分第i+1个类别并将该视频帧特征值划分为第i+1类质心;选择每个类别中距离对应质心最近的视频帧特征值作为关键帧特征值,如果某一类存在多个与质心距离最近的视频帧特征值时,将这些视频帧特征值取算术平均作为该类的关键帧特征值。2.根据权利要求1所述的方法,其特征在于,所述的欧式距离的计算公式如公式(1)所示:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
公式(1)式中, 为某视频帧特征值与某质心的欧式距离,质心包括第一类质心和新一类质心,其中为某视频帧特征值所在m维欧式空间中的点, 为某质心所在m维欧式空间中的点, m为视频帧特征值所包含的多个特征,
ꢀꢀ
为第k个视频帧特征值在m维欧式空间中第i维的值,
ꢀꢀ
为第 j类质心的特征值在m维欧式空间中第i维的值。3.根据权利要求1所述的方法,其特征在于,通过如下公式(2)对第i类中所有视频帧特征值取算术平均以更新第i类质心:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
公式(2)式中代表更新的第j类质心, 代表属于第j类别中的特征值集,应为属于 的某视频帧的特征值。4.根据权利要求1所述的方法,其特征在于,所述提取视频数据中每个视频帧特征值,包括:利用AlexNet神经网络模型提取视频数据中每个视频帧的特征值。5.根据权利要求4所述的方法,其特征在于,所述AlexNet神经网络模型包括依次连接5个卷积层以及2个全连接层;在第一层、第二层以及第五层的卷积层之后分别设有池化层,
各层设有激活函数,将输入视频帧进行前向传播,并将第7层全连接层特征作为输出,得到对应视频帧特征值;所述激活函数如公式(3)所示:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
公式(3)式中,x为所连接的上一层网络结构的输出。6.根据权利要求5所述的方法,其特征在于,所述第一层和第二层卷积后的激活函数经过使用后,利用公式(4)进行局部响应归一化:
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
公式(4)式中, 是归一化后的值,代表激活...

【专利技术属性】
技术研发人员:周政瀚罗标肖淼文张雪侯智焱
申请(专利权)人:成都理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1