一种基于语义挖掘的接触网文本数据缺陷识别方法及设备技术

技术编号：37348205 阅读：27 留言：0更新日期：2023-04-22 21:44

本发明专利技术公开了一种基于语义挖掘的接触网文本数据缺陷识别方法及设备，包括：获取原始接触网文本数据，对原始接触网文本数据进行预处理；将预处理后的接触网文本数据输入至预先建立的文本挖掘

全部详细技术资料下载

【技术实现步骤摘要】
一种基于语义挖掘的接触网文本数据缺陷识别方法及设备

[0001]本专利技术涉及铁路接触网缺陷识别
，涉及一种基于语义挖掘的接触网文本数据缺陷识别方法及设备。

技术介绍

[0002]高速铁路接触网是高速列车能量传输的关键，其运行状况与铁路运输的安全性和可靠性密切相关。由于复杂的故障机制和多变的运行工况，接触网运行风险极高。为了及时发现潜在的缺陷并进行消缺，各种监测技术和维护活动被广泛应用于接触网运行和维护；例如：申请号为2020102694120公开的基于人工智能技术对铁路的接触网图像进行缺陷识别监测的方法。
[0003]进一步，基于相应的监测结果，接触网运维部门积累了大量接触网缺陷记录，这些缺陷记录蕴含了丰富的接触网缺陷问题、消缺方法、原因等缺陷关键特征。但是现有的缺陷记录通常由人工进行统计整合，通过统计整合确定缺陷文本描述，并依据规范文件进行人工分类，相应的文本统计整合工作存在准确度不高、文本信息利用率低、效率低下、成本较高等缺陷，因此，如何能够高效挖掘缺陷记录中包含的信息并进行准确分类、以提高缺陷记录的分析...

【技术保护点】

【技术特征摘要】
1.一种基于语义挖掘的接触网文本数据缺陷识别方法，其特征在于，包括：获取原始接触网文本数据，对所述原始接触网文本数据进行预处理；将预处理后的接触网文本数据输入至预先建立的文本挖掘
‑
缺陷分类模型，利用所述预先建立的文本挖掘
‑
缺陷分类模型生成接触网文本数据的缺陷类别；其中，所述预先建立的文本挖掘
‑
缺陷分类模型为：BERT
‑
DTCN联合模型；其中，BERT子模型用于对预处理后的接触网文本数据进行语义挖掘，DTCN子模型用于对BERT子模型输出的语义挖掘文本进行缺陷分类。2.根据权利要求1所述的基于语义挖掘的接触网文本数据缺陷识别方法，其特征在于，所述BERT子模型具有12层双向Transformer。3.根据权利要求1所述的基于语义挖掘的接触网文本数据缺陷识别方法，其特征在于，所述DTCN子模型包括：嵌入层、等长卷积层、卷积堆叠层和全连接层。4.根据权利要求3所述的基于语义挖掘的接触网文本数据缺陷识别方法，其特征在于，所述等长卷积层，包括：4层二维卷积核以及最大池化层；所述二维卷积核之间采用Pre
‑
activation残差连接。5.根据权利要求4所述的基于语义挖掘的接触网文本数据缺陷识别方法，其特征在于，所述二维卷积核的核参数为3
×
1，stride为1，channel数为140。6.根据权利要求4所述的基于语义挖掘的接触网文本数据缺陷识别方法，其特征在于，所述最大池化层的st...

【专利技术属性】
技术研发人员：蔡俊宇，陈可，王健，谢晨琳，杨佳，邓云川，林宗良，陈科，于龙，钟源，丁润，刘涛，鲁小兵，李默然，杨洋，邵岩，谭磊，刘习文，王彦哲，梁婧文，陈子文，朱晟颉，代玉林，
申请(专利权)人：中铁二院工程集团有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人