一种基于Cox模型的接触网缺陷内因分析方法技术

技术编号:36771596 阅读:7 留言:0更新日期:2023-03-08 21:46
本发明专利技术公开了一种基于Cox模型的接触网缺陷内因分析方法,涉及轨道交通接触网缺陷成因分析技术领域,包括以下步骤:获取历史的接触网缺陷详细记录数据表和接触网缺陷内因因素详细数据表;对缺陷详细记录数据表和内因因素详细数据表中的数据进行预处理;利用预处理后的数据,构建缺陷发生情况与各个内因因素数据的比例风险模型;利用比例风险模型的回归系数,计算每个内因因素对缺陷发生情况的影响权重,以及接触网发生缺陷的概率。本发明专利技术提供的接触网缺陷内因分析方法,不仅考虑内因因素的多维度多因素情况,同时将缺陷发现的时间因素带入了模型,整个分析过程更加全面科学;采用了改进的偏似然函数,既节省了计算资源,也保证了计算精度。证了计算精度。证了计算精度。

【技术实现步骤摘要】
一种基于Cox模型的接触网缺陷内因分析方法


[0001]本专利技术涉及轨道交通接触网缺陷成因分析
,更具体地说涉及一种基于Cox模型的接触网缺陷内因分析方法。

技术介绍

[0002]接触网是整个轨道交通的重要供电设施。列车在运行过程中,车顶受电弓与接触网之间产生高速的相对运动。在相对运动过程中,整个接触网系统受到较大冲击,系统各部位容易频繁发生缺陷。在接触网运维工作中,分析人员通常需要研究引发缺陷产生的原因因素(即内因分析)。良好的内因分析结果可以指导接触网运营改进方案的指定,提高接触网运维工作效率。
[0003]现有的缺陷内因分析工作,主要是依据缺陷记录和接触网运维人员的从业经验,通过简单的数据分析来实现。其主要包括以下步骤:步骤1、分析缺陷记录数据;步骤2、结合实际情况提出缺陷致因因素猜想;步骤3、改变相关致因因素的实际状态;步骤4、重新考察致因因素的改变对缺陷发生情况是否产生影响;步骤5,判断是否有影响,若是,则获取内因分析结论,若否,则返回步骤2中。
[0004]该方法存在以下缺陷:第一,过度依赖运维人员的从业经验。第二,数据来源过于单一,导致缺陷分析维度不够全面。第三,不能从时间的维度进行缺陷分析。

技术实现思路

[0005]为了克服上述现有技术中存在的缺陷,本专利技术公开了一种基于改进的Cox模型的接触网缺陷内因分析方法,本专利技术的目的是解决现有技术中依据缺陷记录和接触网运维人员的从业经验、通过简单的数据分析,存在的缺陷分析维度不够全面、不能从时间的维度进行缺陷分析的问题。本专利技术以统计学中的生存分析为总体思路,以Cox模型及其改进后的偏似然函数为工具,通过对例如制造因素,设计因素,运维因素等内因维度等进行多维度因素分析,实现对接触网缺陷的内因分析。
[0006]为了实现以上目的,本专利技术采用的技术方案:一种基于Cox模型的接触网缺陷内因分析方法,包括以下步骤:1、数据获取S1、获取历史的接触网缺陷详细记录数据表和接触网缺陷内因因素详细数据表;(1)获取历史的缺陷详细记录数据表在接触网运营过程中,可以收集到至少包含各类型电气缺陷或者机械缺陷的发生时间,发生地点(如支柱号和锚段号),处理时间等信息构成的详细记录表。
[0007]本专利技术中,具体可通过获取历史的接触网详细记录数据,以接触网缺陷详细记录数据表来记录。本专利技术中,在构建模型之前通过接触网历史缺陷记录数据的收集和处理来获取缺陷详细记录数据,用于模型的训练。
[0008](2)获取历史的内因因素详细数据表
优选的,所述内因因素包括设计因素、制造因素、施工因素、运维因素、环境累积因素以及其他因素。
[0009]接触网缺陷内因因素可以分为6个维度,分别是设计因素,制造因素,施工因素,运维因素,环境累积因素以及其他因素(其他因素可包括霾、雾、大风、冰雹、大雪、大雨、冻雨、霜降和雷电等因素)。每个维度对应一张数据表。每个维度的数据表中详细记录每个位置(支柱或者锚段)的因素相关值。各维度数据表至少包含支柱号或锚段号,以及该维度对应的各因素相关值。
[0010]本专利技术中,具体可通过获取历史的接触网缺陷内因因素详细数据,以接触网缺陷内因因素详细数据表来记录。本专利技术中,根据内因因素的的性质,制定相应的数据收集方案来获取数据,例如温度可以通过温度传感器收集,车辆速度可以通过查找车辆运营数据来获取。
[0011]2、数据预处理S2、对缺陷详细记录数据表和内因因素详细数据表中的数据进行预处理;上述步骤中,将缺陷详细记录数据表和内因因素详细数据表(以下简称缺陷内因两数据表)中的数据进行预处理,并将预处理后的数据作为建模数据,以便于后续的建模。所述预处理包括以下步骤:(1)缺失值处理S21、对缺陷内因两数据表中的缺失值进行处理;优选的,缺失值处理中,缺失值处理阈值为a,若某因素的数据缺失量占字段数据总量的比例大于等于a,则删除该字段;若该比例小于a,则用该字段的均值代替该字段的缺失值。
[0012]上述缺失值处理步骤中,设缺失值处理阈值为a。缺失值处理是针对每个因素的数据字段进行处理。如果某因素的数据缺失量占字段数据总量的比例大于等于a,则删除该字段;如果该比例小于a,则该字段的缺失值用该字段的均值来代替。
[0013]本专利技术设置上述缺失值处理的目的是针对每个因素的数据字段进行处理,得到可以用于建模的完整数据。
[0014](2)缺陷内因两数据表联合查询S22、缺失值处理后,以支柱号和锚段号为关联字段,在缺陷内因两数据表中进行联合查询,获取缺陷发生位置的内因因素数据;本专利技术中,两表联合查询是指以支柱号和锚段号为关联字段,获取缺陷发生位置的内因因素数据。查询结果表至少包含支柱号和锚段号,缺陷名称,发现时间,以及各因素相关值等。
[0015]本专利技术中,对缺陷内因两数据表联合查询的目的是将支柱号与锚段号进行关联,以获取缺陷发生位置的内因因素数据。
[0016](3)数据标准化S23、对获取的每一个内因因素的数据进行标准化处理;数据标准化步骤中,针对每一个内因因素的数据进行标准化处理。其中,对于内因因素中的导高设计值的标准化为:
其中,为导高设计值的标准化,为支柱i对应的导高设计值的原始值,为所有建模样本中导高设计值的算术平均值,为标准差。
[0017]本专利技术中,对获取的每一个内因因素的数据进行标准化处理,可以控制建模过程中梯度不剧烈变化,同时使后续缺陷发生的影响权重计算更加准确。
[0018](4)构造标签数据和时间表征量S24、标准化处理后,利用标准化后的数据生成建模数据,并在建模数据中加入缺陷发生标签字段和时间表征量。
[0019]本专利技术中,生成的建模数据包括标准化处理后的内因因素数据。
[0020]优选的,所述缺陷发生标签字段中,如果某位置发生缺陷,则该位置的标签值为1;如果未发生缺陷,则该位置的标签值为0。
[0021]优选的,所述时间表征量中,若是同一条线路进行分析,则统计每个支柱的缺陷发现时间点与最近一次维修时间点之间的时长,用作时间表征量;若不是同一条线路,则统计每个支柱的缺陷发现时间点之前经过每个支柱的车次数量,用作时间表征量。
[0022]本专利技术中,加入标签数据的目的是用于快速验证构建的Cox模型是否达到目标效果,加入时间表征量数据的目的是用于快速判断缺陷发生的时长。
[0023]3、基于改进的似然函数构建的Cox模型S3、利用预处理后的数据,构建缺陷发生情况与各个内因因素数据的比例风险模型;本专利技术中,假设总体支柱数据量为N。参与建模的内因因素总数为P。利用建模数据构建缺陷发生情况与各个内因因素数据的比例风险模型(即Cox模型)。
[0024]优选的,所述比例风险模型为:其中,为模型输出的比例风险值,为模型的回归系数, 为内因因素,为基础风险比例函数。
[0025]本专利技术中,基础风险比例函数可以通过查询相关国家或行业标准获得。如果在标准文件中无相关数据,则可以使用当前建模样本通过非参数统计获得,计算公式本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于Cox模型的接触网缺陷内因分析方法,其特征在于,包括以下步骤:获取历史的接触网缺陷详细记录数据表和接触网缺陷内因因素详细数据表;对缺陷详细记录数据表和内因因素详细数据表中的数据进行预处理;利用预处理后的数据,构建缺陷发生情况与各个内因因素数据的比例风险模型;利用比例风险模型的回归系数,计算每个内因因素对缺陷发生情况的影响权重,以及接触网发生缺陷的概率。2.如权利要求1所述的接触网缺陷内因分析方法,其特征在于,所述接触网缺陷详细记录数据包括各类型电气缺陷或者机械缺陷的相关数据,所述相关数据包括缺陷名称、发生时间、发生地点和处理时间,所述发生地点包括支柱号和锚段号;所述接触网缺陷内因因素详细数据包括6个维度因素数据,所述6个维度因素包括设计因素、制造因素、施工因素、运维因素、环境累积因素和其他因素。3.如权利要求1所述的接触网缺陷内因分析方法,其特征在于,所述预处理包括以下步骤:对缺陷内因两数据表中的缺失值进行处理;以支柱号和锚段号为关联字段,在缺陷内因两数据表中进行联合查询,获取缺陷发生位置的内因因素数据;对获取的每一个内因因素的数据进行标准化处理;利用标准化后的数据生成建模数据,并在建模数据中加入缺陷发生标签字段和时间表征量。4.如权利要求3所述的接触网缺陷内因分析方法,其特征在于,在缺失值处理中,缺失值处理阈值为a,若某因素的数据缺失量占字段数据总量的比例大于等于a,则删除该字段;若该比例小于a,则用该字段的均值代替该字段的缺失值;在标准化处理中,对于内因因素中的导高设计值的标准化为:其中,为导高设计值的标准化,为支柱i对应的导高设计值的原始值,为所有建模样本中导高设计值的算术平均值,为标准差;在缺陷发生标签字段加入中,如果某位置发生缺陷,则该位置的标签值为1;如果未发生缺陷,则该位置的标签值为0;在时间表征量加入中,若是同一条线路进行分析,则统计每个支柱的缺陷发现时间点与最近一次维修时间点之间的时长,用作时间表征量;若不是同一条线路,则统计每个支柱的缺陷发现时间点之前经过每个支柱的车次数量,用作时间表征量。5.如权利要求...

【专利技术属性】
技术研发人员:张金鑫熊昊睿黄瀚韬李俊兵姚刚鲜永昌杨鹏远
申请(专利权)人:成都智谷耘行信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1