当前位置: 首页 > 专利查询>东南大学专利>正文

一种基于自然语言处理的桥梁技术状况等级快速识别方法技术

技术编号:32267195 阅读:6 留言:0更新日期:2022-02-12 19:30
本发明专利技术提供一种基于自然语言处理的桥梁技术状况等级快速识别方法,包括如下步骤:步骤1,通过桥梁检测手段得到桥梁的基本信息和健康状态信息;步骤2,将桥梁的健康状态信息整体成文本描述;步骤3,对桥梁技术状况等级进行分类;步骤4,将文本秒速转换为数字向量,将一类、二类、三类、四类五类桥梁样本分别记为A、B、C、D;步骤5,将文本向量作为输入,将分类类别作为输出,使用机器学习算法建立训练模型;步骤6,使用混淆矩阵、准确率、召回率、精确率、F1值等作为评价指标,选择最优的模型作为最终结果;步骤7,应用模型。本发明专利技术克服了目前的人工检测后整体判别效率较低,难以快速找出损害严重桥梁的问题。重桥梁的问题。重桥梁的问题。

【技术实现步骤摘要】
一种基于自然语言处理的桥梁技术状况等级快速识别方法


[0001]本专利技术属于桥梁状态检测领域,尤其涉及一种基于自然语言处理和机器学习算法桥梁技术状况等级快速识别方法。

技术介绍

[0002]桥梁在自身寿命、车辆行人等荷载、日晒雨淋等自然腐蚀以及意外碰撞和地震等意外作用影响下会存在不同程度的损伤,需要定期对桥梁进行健康状况评估,对损坏严重的桥梁采取维修等措施以避免事故。
[0003]目前桥梁检测手段主要由工程师团队近距离人工观测或者接触式采集数据,得到对应病害情况,再由专业人员依照桥梁评估标准评价打分,形成报告。但是这种方式对评定人员要求高,需要其熟悉相关评定标准。此外,由于现场检测桥梁数量较多,评定人员依据标准人工评定费时费力,且主观性较强,如不同评定人员可能得到不同的桥梁评定技术状况等级。
[0004]基于上述问题,本专利技术专利提供了一种基于自然语言处理和机器学习的桥梁技术状况等级快速评价方法,该专利技术方法可以有效准确判断桥梁整体健康状况,覆盖了大中小等各种类型桥梁,可以有效针对病害严重的桥梁优先修复,为桥梁日常运营和维修提供指导。

技术实现思路

[0005]本专利技术所要解决的技术问题是针对
技术介绍
的不足提供了一种基于自然语言处理和机器学习算法桥梁技术状况等级快速识别方法,克服了目前的人工检测后整体判别效率较低,难以快速找出损害严重桥梁的问题。
[0006]本专利技术为解决上述技术问题采用以下技术方案:
[0007]一种基于自然语言处理和机器学习算法桥梁技术状况等级快速识别方法,包括如下步骤:
[0008]步骤1,通过桥梁检测手段得到桥梁的基本信息和健康状态信息;
[0009]步骤2,将桥梁的健康状态信息整体成文本描述;
[0010]步骤3,对桥梁技术状况等级进行分类;依据重要程度对桥梁部件赋权,在对部件损伤情况打分,最后加权求和得到桥梁整体得分,划分为一到五共五个类别;
[0011]步骤4,使用自然语言处理处理文本,通过Python编程,使用Jieba、TF

IDF将文本秒速转换为数字向量,将一类、二类、三类、四类五类桥梁样本分别记为A、B、C、D;
[0012]步骤5,将文本向量作为输入,将分类类别作为输出,使用机器学习算法建立训练模型;
[0013]步骤6,选择合适算法、调整超参数,得到分类效果最优的模型,使用混淆矩阵、准确率、召回率、精确率、F1值等作为评价指标,选择最优的模型作为最终结果;
[0014]步骤7,应用模型;根据已建立的模型,输入桥梁病害描述即可快速得到桥梁技术
状况等级。
[0015]进一步的,步骤1中,基本信息包括桥型、跨度;健康状态信息包括混凝土开裂剥落情况、钢筋锈蚀情况、垃圾堵塞情况。
[0016]进一步的,步骤2中,所述健康状态信息按照上部结构、桥面系、下部结构分别描述。
[0017]进一步的,步骤2中,所述上部结构包括上部主要承重构件、上部一般承重构件等;桥面系包括桥面铺装、桥头跳车、伸缩缝、人行道、栏杆、护栏、照明、标志、排水设施、调治构造物、其它等;下部结构包括翼墙、耳墙、锥坡、护坡、桥台及基础、桥墩及基础、地基冲刷、支座等。
[0018]进一步的,步骤3中,分类方法为,根据现有规范,依据重要程度对桥梁部件赋权,其中桥台及基础、桥墩及基础、上部主要承重构件、桥面系、地基冲刷部位权重较高,分别赋以24、23、20、11、8的权重,其他部分权重为14,综合权重为100;再对部件损伤情况打分,按照损伤情况以及损伤发展情况打0~5分,最后加权求和得到桥梁整体得分,划分为一到五共五个类别,一二类别桥梁较为健康,三四五类桥梁需要重点检测维修。
[0019]进一步的,步骤4中,使用Jieba将中文语料切分为单个词语,去掉标点数字助词等无关词语,并统计各个词语出现频率生成词云图,再使用TF

IDF统计特征词汇并将其向量化,将一类、二类、三类、四类五类桥梁样本分别标记为A、B、C、D四类。
[0020]进一步的,步骤5中,将文本向量作为输入,将分类类别作为输出,训练集与测试集划分比例为0.7∶0.3,使用单学习器SVM、DT与集成学习器RF、XGB算法训练模型,使用网格搜索寻找最优超参数,得到最优模型。
[0021]本专利技术采用以上技术方案与现有技术相比,具有以下技术效果:
[0022]本专利技术将桥梁健康状态的文本描述经由自然语言处理转换为数字向量作为输入,将各类桥梁等级作为输出,使用机器学习算法进行分类训练预测,可以实现基于文本对桥梁技术状况等级的快速评估;克服目前的人工检测后整体判别效率较低,难以快速找出损害严重桥梁的问题。
附图说明
[0023]图1是技术路线图;
[0024]图2是D类样本的词频统计以及关键词的TF

IDF值;
[0025]图3是网格搜索结果图;
[0026]图4是XGB算法在训练集上的预测结果;
[0027]图5是XGB算法在测试集上得预测结果。
具体实施方式
[0028]下面结合附图对本专利技术的技术方案做进一步的详细说明:
[0029]本专利技术的描述中,需要理解的是,术语“左侧”、“右侧”、“上部”、“下部”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,“第一”、“第二”等并不表示零部件的重要程度,因此不能理解为对本专利技术的限制。本实施例中
采用的具体尺寸只是为了举例说明技术方案,并不限制本专利技术的保护范围。
[0030]本专利技术提供的一种基于自然语言处理和机器学习算法桥梁技术状况等级快速识别方法,包括如下步骤:
[0031]步骤1,通过桥梁检测手段得到桥梁的基本信息和健康状态信息;基本信息包括桥型、跨度;健康状态信息包括混凝土开裂剥落情况、钢筋锈蚀情况、垃圾堵塞情况。
[0032]步骤2,将桥梁的健康状态信息整体成文本描述;所述健康状态信息按照上部结构、桥面系、下部结构分别描述。所述上部结构包括上部主要承重构件、上部一般承重构件等;桥面系包括桥面铺装、桥头跳车、伸缩缝、人行道、栏杆、护栏、照明、标志、排水设施、调治构造物、其它等;下部结构包括翼墙、耳墙、锥坡、护坡、桥台及基础、桥墩及基础、地基冲刷、支座等。
[0033]步骤3,对桥梁技术状况等级进行分类;依据重要程度对桥梁部件赋权,在对部件损伤情况打分,最后加权求和得到桥梁整体得分,划分为一到五共五个类别;分类方法为,根据现有规范,依据重要程度对桥梁部件赋权,其中桥台及基础、桥墩及基础、上部主要承重构件、桥面系、地基冲刷部位权重较高,分别赋以24、23、20、11、8的权重,其他部分权重为14,综合权重为100;再对部件损伤情况打分,按照损伤情况以及损伤发展情况打0~5分,最后加权求和得到桥梁整体得分,划分为一到五本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自然语言处理和机器学习算法桥梁技术状况等级快速识别方法,其特征在于:包括如下步骤:步骤1,通过桥梁检测手段得到桥梁的基本信息和健康状态信息;步骤2,将桥梁的健康状态信息整体成文本描述;步骤3,对桥梁技术状况等级进行分类;依据重要程度对桥梁部件赋权,在对部件损伤情况打分,最后加权求和得到桥梁整体得分,划分为一到五共五个类别;步骤4,使用自然语言处理文本,通过Python编程,使用Jieba、TF

IDF将文本秒速转换为数字向量,将一类、二类、三类、四类五类桥梁样本分别记为A、B、C、D;步骤5,将文本向量作为输入,将分类类别作为输出,使用机器学习算法建立训练模型;步骤6,选择决策树DT、支持向量机SVM、随机森林RF、极端梯度提升XGB四种机器学习算法、调整超参数,得到分类效果最优的模型,使用混淆矩阵、准确率、召回率、精确率、F1值等作为评价指标,选择最优的模型作为最终结果;步骤7,应用模型;根据已建立的模型,输入桥梁病害描述即可快速得到桥梁技术状况等级。2.根据权利要求1所述的一种基于自然语言处理和机器学习算法桥梁技术状况等级快速识别方法,其特征在于:步骤1中,基本信息包括桥型、跨度;健康状态信息包括混凝土开裂剥落情况、钢筋锈蚀情况、垃圾堵塞情况。3.根据权利要求1所述的一种基于自然语言处理和机器学习算法桥梁技术状况等级快速识别方法,其特征在于:步骤2中,所述健康状态信息按照上部结构、桥面系、下部结构分别描述。4.根据权利要求3所述的一种基于自然语言处理和机器学习算法桥梁技术状况等级快速识别方法,其特征在于:步骤2中...

【专利技术属性】
技术研发人员:冯德成王文捷孙震
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1