【技术实现步骤摘要】
一种基于大数据的异常航班识别方法
本专利技术涉及航空航班数据监测
,特别是涉及一种基于大数据的异常航班识别方法。
技术介绍
随着社会生产力的发展,科学技术的不断进步,我国航空业务的不断发展,在航空业务的不断进步的同时就需要利用航空数据进行整理用来管理航空业务,航空数据的核心在大量的收集数据中获取到航空数据潜在的价值,从而不断航空业务的良性发展。但是在现有数据中因为航空数据存在异常信息,会影响收集数据的准确性、耗费大量的人力成本以及监测成本。因此,针对现有技术不足,提供一种基于大数据的异常航班识别方法以克服现有技术不足甚为必要。
技术实现思路
本专利技术的目的在于避免现有技术的不足之处而提供一种基于大数据的异常航班识别方法,该基于大数据的异常航班识别方法能够自动识别航空数据中的异常状态,能够同时计算大量的航空数据,降低数据监测成本。本专利技术的上述目的通过如下技术手段实现。提供一种基于大数据的异常航班识别方法,设置有数据采集模块、数据处理模块以及异常检测模块,数据采集模块与数据处理模块连接,数据处理模块与异常检测模块连接,优选的,数据采集模块用于采集航班历史订座元数据并将采集到的历史订座元数据发送至数据处理模块,优选的,数据处理模块对历史订座元数据进行数据清洗得到第一数据,并将第一数据发送至异常检测模块,优选的,异常检测模块根据第一数据通过孤立森林算法计算步骤得到数据异常指数并根据所计算得到的数据异常指数判断第一数据是否异常。优选 ...
【技术保护点】
1.一种基于大数据的异常航班识别方法,其特征在于:设置有数据采集模块、数据处理模块以及异常检测模块,所述数据采集模块与所述数据处理模块连接,所述数据处理模块与所述异常检测模块连接;/n所述数据采集模块采集航班历史订座元数据并将采集到的历史订座元数据发送至所述数据处理模块,/n所述数据处理模块对历史订座元数据进行数据清洗得到第一数据,并将第一数据发送至所述异常检测模块,/n所述异常检测模块根据所述第一数据通过孤立森林算法计算得到数据异常指数并根据所计算得到的数据异常指数判断第一数据是否异常。/n
【技术特征摘要】 【专利技术属性】
1.一种基于大数据的异常航班识别方法,其特征在于:设置有数据采集模块、数据处理模块以及异常检测模块,所述数据采集模块与所述数据处理模块连接,所述数据处理模块与所述异常检测模块连接;
所述数据采集模块采集航班历史订座元数据并将采集到的历史订座元数据发送至所述数据处理模块,
所述数据处理模块对历史订座元数据进行数据清洗得到第一数据,并将第一数据发送至所述异常检测模块,
所述异常检测模块根据所述第一数据通过孤立森林算法计算得到数据异常指数并根据所计算得到的数据异常指数判断第一数据是否异常。
2.根据权利要求1所述的基于大数据的异常航班识别方法,其特征在于:所述数据清洗具体为:
S1,通过Python将航班历史订座元数据文件分类,得到分类数据;
S2,去除步骤S1中的分类数据中的无效重复错误航班历史订座元数据,得到有效的航班历史订座元数据;
S3,将有效的航班历史订座元数据进行格式化处理得到第一数据。
3.根据权利要求2所述的基于大数据的异常航班识别方法,其特征在于:所述孤立森林算法计算过程包括模型数据训练阶段以及预测异常判断阶段。
4.根据权利要求3所述的基于大数据的异常航班识别方法,其特征在于:所述模型数据训练阶段建立了t个孤立树,t≥1,t为孤立树的个数,且t为正整数。
5.根据权利要求4所述的基于大数据的异常航班识别方法,其特征在于:每个孤立树建立的过程为:
步骤a1-1,从第一数据中随机无放回选取ψ个数据作为子样本放入树的根节点建立孤立树根节点,ψ≥1,ψ为正整数,ψ个数据中属性最多的数据具有T个属性;
步骤a1-2,选择第一数据中任意一项属性作为第一固定属性,根据第一固定属性对ψ个数据进行切割,具有第一固定属性的第一数据构成Q11数据集、没有第一固定属性的第一数据构成Q12数据集,切割得到的Q11数据集、Q12数据集建立为孤立树第一层;
步骤a1-3,定义K为切割次数,K为自然数且K≤ψ-1;令K=2,进入步骤a1-4,
步骤a1-4,随机指定Q(K-1)1数据集中数据的未使用过的任意属性作为第K属性,在前孤立树第K-1层的节点上对Q(K-1)1数据集中的数据以第K属性进行切割,具有第K属性的数据分割到QK1数据集,不具有第K属性的数据分割到QK2数据集,切割得到的QK1数据集、QK2数据集建立为孤立树第K层;
步骤a1-5,判断QK1数据集中的数据是否满足限定切割条件,如果是,则进入步骤a1-7;如果否,则进入步骤a1-6;
步骤a1-6,令K=K+1,返回步骤a1-4;
技术研发人员:刘震,李数,周兴,
申请(专利权)人:广州优策科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。