一种基于多源数据分析的风险指数预测方法及系统技术方案

技术编号:28464104 阅读:23 留言:0更新日期:2021-05-15 21:29
本发明专利技术提供了一种基于多源数据分析的风险指数预测方法及系统,基于历史数据建立风险指数模型,得出运行数据的风险标签值,再通过机器学习算法实现基于实时运行数据的风险指数预测,最终实现风险指数的显示与应用,实现基于多源数据分析的实时风险指数预测,为复杂多变因素交织的交通系统提供数据支持,形成智能预警机制。能预警机制。

【技术实现步骤摘要】
一种基于多源数据分析的风险指数预测方法及系统


[0001]本专利技术涉及数据分析领域,尤其涉及一种基于多源数据分析的风险指数预测方法及系统。

技术介绍

[0002]随着社会发展,人们对各交通系统的保障需求越来越高,特别是对于大型机场而言,机场客流量不断增加,对机场交通的保障需求也不断增高。但是由于地铁、长途车、公交车等在夜间均停止运行,机场运力在夜间的锐减与夜间航班到达高峰叠加,对机场陆侧交通保障运行造成巨大的压力,并且对这一压力缺乏风险预感,从而对机场到港疏散交通信息管理缺乏数据和技术支持,使得在机场陆侧交通的服务供应保障上十分被动。因此围绕机场陆侧到港疏散交通信息管理,以实现机场陆侧到港交通信息最佳感知为目标,全面汇集空、陆交通相关的动态数据,形成多维度的数据采集与关联模型分析,提供在复杂多变因素交织情况下的更加精准的机场交通保障风险预测,是一个非常重要而有意义的研究课题。
[0003]有鉴于此,有必要对现有技术中的机场交通保障风险预测方法及系统予以改进,以解决上述问题。

技术实现思路

[0004]本专利技术的目的在于实现基于多源数据分析的实时风险指数预测,为复杂多变因素交织的交通系统提供数据支持,形成智能预警机制。
[0005]为实现上述目的,本专利技术提供了一种基于多源数据分析的风险指数预测方法,包括以下步骤:
[0006]步骤1.基于数据分析与特征构造的方法,使用历史运行数据建立风险指数模型,从而得出带风险标签值的历史数据;
[0007]步骤2.基于机器学习算法使用所述带风险标签值的历史数据建立风险指数预测模型;
[0008]步骤3.基于实时运行数据,通过所述风险指数预测模型实现实时风险指数预测。
[0009]进一步地,所述风险指数模型的建立方法步骤包括:
[0010]1)对所述历史数据进行数据分析,得到初步风险指标值;
[0011]2)对所述历史数据进行特征构造,得到特征控制值;
[0012]3)结合所述初步风险指标值和所述特征控制值,得到所述带风险标签值的历史数据。
[0013]进一步地,所述数据分析的方法可以有但不限于数据清洗、数据间的逻辑运算,数据归一化。
[0014]进一步地,所述特征控制值设定有特征控制系数;所述特征控制系数可以是一个区间范围,也可以是一个固定值。
[0015]进一步地,所述风险指数预测模型建立的具体方法步骤为:
[0016]Step1将所述带风险标签值的历史运行数据划分为训练数据集和测试数据集;
[0017]Step2所述训练数据集上基于LightGBM算法训练得到风险指数预测模型;
[0018]Step3结合验证损失进一步模型优化,得到较优模型;
[0019]Step4测试数据集上基于所述较优模型实现风险指数预测,得到风险预测结果输出。
[0020]进一步地,所述训练和验证的评估指标参数均为RMSE;所述Step3和Step4循环进行直至得到较为理想的模型参数;所述较优模型具有所述较为理想的模型参数。
[0021]本专利技术还提供一种上述风险指数预测方法的风险预测系统,包括数据模块、预测模型建立模块、实时应用模块;所述数据模块通过对数据进行采集分析处理等,获得带风险标签值的数据;
[0022]所述预测模型建立模块,基于机器学习算法使用所述带风险标签值的数据建立风险指数预测模型;
[0023]所述实时应用模块,基于实时数据通过所述风险指数预测模型输出实时风险指数,并通过平台展示。
[0024]进一步地,所述平台展示可以根据不同的风险指数设定不同的应急预警方案。
[0025]与现有技术相比,本专利技术的有益效果是:基于历史数据建立风险指数模型,得出运行数据的风险标签值,再通过机器学习算法实现基于实时运行数据的风险指数预测,最终实现风险指数的显示与应用,以此来调节影响风险指数的各项特征,消除、降低运行保障风险,使得风险均匀的分布在一定的时期内,减少风险指数波动。
附图说明
[0026]图1为本专利技术一种基于多源数据分析的风险指数预测方法步骤示意图;
[0027]图2为风险指数模型建立的具体方法步骤示意图;
[0028]图3为风险指数预测模型建立的具体方法步骤示意图;
[0029]图4为风险指数预测模型建立的逻辑流程示意图;
[0030]图5为本专利技术一种基于风险指数预测方法的风险预测系统的流程示意图。
具体实施方式
[0031]下面结合附图所示的各实施方式对本专利技术进行详细说明,但应当说明的是,这些实施方式并非对本专利技术的限制,本领域普通技术人员根据这些实施方式所作的功能、方法、或者结构上的等效变换或替代,均属于本专利技术的保护范围之内。
[0032]请参图1所示,本专利技术一种基于多源数据分析的风险指数预测方法,具体包括以下步骤:
[0033]步骤1.基于数据分析与特征构造的方法,使用历史运行数据建立风险指数模型,从而得出每条带风险标签值的历史运行数据。
[0034]具体的,如图2所示,风险指数模型建立的具体方法为:
[0035]1.对历史数据进行数据分析,得到初步风险指标值。具体地,数据分析的方法可以有但不限于数据清洗、数据间的逻辑运算,数据归一化等。
[0036]2.对历史数据进行特征构造,得到特征控制值。具体地,特征构造需根据数据本身的特点和实际场景的特殊性对最终的风险标签值的影响程度而确定具体的控制特征,比如对于航班延误风险预测来讲,除了通过飞行速度和飞行距离这样的直接数据预测外,也需要结合考虑抵达机场的航空管制情况,那么航空管制情况需要确定为该航班延误风险预测的控制特征之一。
[0037]3.结合初步风险指标值和特征控制值,得到带风险标签值的历史运行数据。特别地,为了使特征控制值对初步风险指标值的影响限定在一定的影响范围内,避免融入过多的极端情景而使得最终风险标签值失去了区分度,在实际应用中,对特征控制值设定了可调的特征控制系数。该特征控制系数可以是一个区间范围,也可以是通过一定数量的情景模拟,最终确定为一个最利于该应用场景的固定值。
[0038]步骤2.基于机器学习算法使用带风险标签值的历史运行数据建立风险指数预测模型。
[0039]具体的,如图3

图4所示,风险指数预测模型建立的具体方法为:
[0040]1.将带风险标签值的历史运行数据划分为训练数据集和测试数据集。具体地,将历史运行数据中时间较前的数据划分为训练数据集,时间靠后的数据划分为测试数据集,如此能够更符合模型的实际运行规律。
[0041]2.训练数据集上基于LightGBM算法训练得到风险指数预测模型。具体地,通过LightGBM算法训练能够得出风险指数预测模型的初步模型参数。
[0042]3.结合验证损失进一步模型优化,得到较优模型。特别地,这里训练和验证的评估指标参数均为RMSE。如图4所示,训练数据集的数据经本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多源数据分析的风险指数预测方法,其特征在于:步骤1.基于数据分析与特征构造的方法,使用历史运行数据建立风险指数模型,从而得出带风险标签值的历史数据;步骤2.基于机器学习算法使用所述带风险标签值的历史数据建立风险指数预测模型;步骤3.基于实时运行数据,通过所述风险指数预测模型实现实时风险指数预测。2.如权利要求1所述的风险指数预测方法,其特征在于:所述风险指数模型的建立方法步骤包括:1)对所述历史数据进行数据分析,得到初步风险指标值;2)对所述历史数据进行特征构造,得到特征控制值;3)结合所述初步风险指标值和所述特征控制值,得到所述带风险标签值的历史数据。3.如权利要求2所述的风险指数预测方法,其特征在于:所述数据分析的方法可以有但不限于数据清洗、数据间的逻辑运算,数据归一化。4.如权利要求2所述的风险指数预测方法,其特征在于:所述特征控制值设定有特征控制系数;所述特征控制系数可以是一个区间范围,也可以是一个固定值。5.如权利要求1所述的风险指数预测方法,其特征在于:所述风险指数预测模型建立的具体方法步骤为:Step1将所述带风险标签值...

【专利技术属性】
技术研发人员:刘君
申请(专利权)人:上海鹭航科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1