本发明专利技术涉及民航信息技术领域。分析报文的相关性,获得报文之间直接的或者间接的联系,本发明专利技术采取的技术方案是,基于访问信息挖掘的民航报文相关性分析方法,包括如下步骤:1)获取民航报文的访问记录;2)基于步骤1)的访问记录,分析报文内容,将具有一致性信息的报文放至同一集合中;3)设置最小支持度,报文出现的频率需大于该支持度;4)基于步骤2)的报文集和步骤3)的最小支持度,产生一维频繁报文集;5)对产生的一维频繁报文集,循环处理直至未能再产生维数更高的频繁报文集;6)基于步骤4),步骤5),得到报文所有维数的频繁报文集,分析这些报文集,即可得出报文的相关性。本发明专利技术主要应用于民航信息处理。
【技术实现步骤摘要】
本专利技术涉及民航信息
,涉及民航报文相关性的分析方法。具体讲,涉及。
技术介绍
随着民航运输流量的增大以及民航信息技术的发展,民航报文的使用越来越频繁,重要性越来越显著。民航报文种类繁多,总体分为航管飞行动态AFTN报文、航空公司SITA报文和民航机场气象报文等。各种报文之间有不同程度的相关性。比如民航机场气象报文发送后,空管员根据气象报文分析是否适宜降落,随后结果就会被反映到航班的落地报里,这两种报文的相关性就非常高。分析报文的相关性,获得报文之间直接的或者间接的联系,对民航信息
非常重要。报文相关性分析采用访问信息挖掘的技术,主要是priori方法。访问信息挖掘利用数据挖掘技术从相关的资源和行为中抽取感兴趣的、有用的模式和隐含信息,涉及数据挖掘、计算机语言学、信息学等多个领域,是一项综合技术。
技术实现思路
本专利技术旨在克服现有技术的不足,分析报文的相关性,获得报文之间直接的或者间接的联系。为达到上述目的,本专利技术采取的技术方案是,,包括如下步骤I)获取民航报文的访问记录;2)基于步骤I)的访问记录,分析报文内容,将具有一致性信息的报文放至同一集合中;3)设置最小支持度,报文出现的频率需大于该支持度;4)基于步骤2)的报文集和步骤3)的最小支持度,统计所有报文出现的频率,找出大于或等于最小支持度的报文,产生一维频繁报文集;5)基于步骤3)的最小支持度,基于步骤4)的一维频繁报文集,对产生的一维频繁报文集,循环处理直至未能再产生维数更高的频繁报文集;6)基于步骤4),步骤5),得到报文所有维数的频繁报文集,分析这些报文集,即可得出报文的相关性。所述步骤I)的访问记录由数据库日志,网站日志等获取。所述步骤2)中的一致性信息是包括航班号、机场的相同信息,将具有一致性内容的报文放在同一集合中,以保证分析结果的有效性。所述步骤3)的最小支持度范围为O. 01-0. 99,实际取值由使用者决定。所述步骤5)的多维频繁报文集解释为若报文集内有k个相关联报文,则为K维频繁报文集,其频数为在记录中同时出现的次数。所述步骤5)的实施应满足如下条件I)所获得报文频繁集出现的频率必须大于最小支持度。2)由K维频繁报文集产生K+1维频繁报文集时,必须考虑到k维频繁报文集中的所有组合。循环处理过程的第一步是简单统计所有含一个元素的报文出现的频率,来决定最大的一维报文项目集,及步骤4)所做工作;在第k步,分两个阶段,首先通过第(k-Ι)步中生成的最大报文集来生成侯选报文项目集.然后搜索数据库计算侯选项目集的支持度.若候选项目集的支持度大于步骤3)设置的最小支持度,则将该报文项目集放入k维频繁报文集。所述步骤6)的报文相关性由频繁报文集产生,相关性系数为频繁报文集的频数。本专利技术的技术特点及效果本专利技术充分利用了数据挖掘技术中的现有研究和实现成果,可以方便的对报文的访问记录进行分析,计算出报文的相关性。本专利技术的应用不依赖于报文的存储和传播方式,使用者可以根据应用需求,选择最合适的报文存储和传播方式,以获得最佳使用效果。处理的数据是航班运行的报文数据,通过本专利技术的分类处理,提高了航班报文分析效率和准确性,实现航班运行管理的水平。附图说明图1是本专利技术的系统组成结构具体实施例方式技术方案采取的步骤如下I)获取民航报文的访问记录。2)基于步骤I)的访问记录,分析报文内容,将具有一致性信息的报文放至同一集由口卞ο3)设置最小支持度,报文出现的频率需大于该支持度。4)基于步骤2)的报文集和步骤3)的最小支持度,统计所有报文出现的频率,找出大于或等于最小支持度的报文,产生一维频繁报文集。5)基于步骤3)的最小支持度,基于步骤4)的一维频繁报文集,对产生的一维频繁报文集,循环处理直至未能再产生维数更高的频繁报文集。6)基于步骤4),步骤5),得到报文所有维数的频繁报文集,分析这些报文集,即可得出报文的相关性。所述步骤I)的访问记录可由数据库日志,网站日志等获取。所述步骤2)中的一致性信息包括航班号、机场等相同信息。将具有一致性内容的报文放在同一集合中,以保证分析结果的有效性。记录集合如表I所示。所述步骤3)的最小支持度范围为O. 01-0. 99。实际取值由使用者决定。支持度越大,相关性分析越准确,但是一些具有隐含关联的报文可能会被遗漏。所述步骤4)中一维频繁报文集由报文出现的频率和支持度来决定。一维频繁集示例如表2所示。所述步骤5)的多维频繁报文集解释为若报文集内有k个相关联报文,则为K维频繁报文集,其频数为在记录中同时出现的次数。3维频繁报文集如表3所示。所述步骤5)的实施应满足如下条件I)所获得报文频繁集出现的频率必须大于最小支持度。2)由K维频繁报文集产生K+1维频繁报文集时,必须考虑到k维频繁报文集中的所有组合。所述步骤6)的报文相关性由频繁报文集产生,相关性系数为频繁报文集的频数。现结合附图和实施例对本专利技术做进一步说明。 如表1、表2、表3和附图所不,本专利技术的具体实施过程和工作原理如下I)根据民航报文的具体应用环境,从数据库日志或网站日志等存储环境中获取访问记录。2)根据报文日志,在同一访问记录中,将有相关性信息的报文放在同一集合中。同一访问记录可以生成一个或多个上述报文集合。报文集合如表I所示。3)根据实际情况,设置最小支持度。最小支持度越小,获取的报文相关性信息越多,但效率越低。反之亦然。4)统计所有报文出现的频率,找出大于或等于最小支持度的报文,产生一维频繁报文集。如表2所示。5)对产生的一维频繁报文集,循环处理直至未能再产生维数更高的频繁报文集。流程图如附图所示。循环处理过程采用了 apriori算法的思想。Apriori算法的第一步是简单统计所有含一个元素的报文出现的频率,来决定最大的一维报文项目集,及步骤4)所做工作。在第k步,分两个阶段,首先通过第(k-Ι)步中生成的最大报文集来生成侯选报文项目集.然后搜索数据库计算侯选项目集的支持度.若候选项目集的支持度大于步骤3)设置的最小支持度,则将该报文项目集放入k维频繁报文集。循环处理过程算法描述如下(I)L1 = { 一维频繁报文集};(2) for (k = 2 !Llrf 幸 Φ ;k++) {(3) Ck = apriori_gen (L^1, min_sup);(4) for each record r e R{(5) Cr = subset (Ck, r);(6) for each candidate c e Cr(7) c. count++ ;(8)}(9) Lk = {c e Ck I c. count ^ min_sup}(10)}(II) return L = U Lk;其中,Lk为k维频繁报文集,Ck为候选频繁报文集,min_sup为最小支持度,R为步骤2)生成的报文记录,(;为记录r所包含的候选。(2)表示从k-Ι维频繁报文集生成候选频繁报文集Ck。(4)表示扫描报文记录。(5)表示从记录r中找出在Ck中的候选。(6)、(7)表示若在记录中找到候选,则对应候选的频数增加1.其中C属于Cy为一种报文。c. count表示报文的出现次数。(9)表示若报文候选集的出现的频率大于最小支持度,则将其加入K维报文频繁集合中。(11)表示返回生成的所有本文档来自技高网...
【技术保护点】
一种基于访问信息挖掘的民航报文相关性分析方法,其特征是,包括如下步骤:1)获取民航报文的访问记录;2)基于步骤1)的访问记录,分析报文内容,将具有一致性信息的报文放至同一集合中;3)设置最小支持度,报文出现的频率需大于该支持度;4)基于步骤2)的报文集和步骤3)的最小支持度,统计所有报文出现的频率,找出大于或等于最小支持度的报文,产生一维频繁报文集;5)基于步骤3)的最小支持度,基于步骤4)的一维频繁报文集,对产生的一维频繁报文集,循环处理直至未能再产生维数更高的频繁报文集;6)基于步骤4),步骤5),得到报文所有维数的频繁报文集,分析这些报文集,即可得出报文的相关性。
【技术特征摘要】
1.一种基于访问信息挖掘的民航报文相关性分析方法,其特征是,包括如下步骤1)获取民航报文的访问记录;2)基于步骤I)的访问记录,分析报文内容,将具有一致性信息的报文放至同一集合中;3)设置最小支持度,报文出现的频率需大于该支持度;4)基于步骤2)的报文集和步骤3)的最小支持度,统计所有报文出现的频率,找出大于或等于最小支持度的报文,产生一维频繁报文集;5)基于步骤3)的最小支持度,基于步骤4)的一维频繁报文集,对产生的一维频繁报文集,循环处理直至未能再产生维数更高的频繁报文集;6)基于步骤4),步骤5),得到报文所有维数的频繁报文集,分析这些报文集,即可得出报文的相关性。2.如权利要求1所述的一种基于访问信息挖掘的民航报文相关性分析方法,其特征是,所述步骤I)的访问记录由数据库日志,网站日志等获取。3.如权利要求1所述的一种基于访问信息挖掘的民航报文相关性分析方法,其特征是,所述步骤2)中的一致性信息是包括航班号、机场的相同信息,将具有一致性内容的报文放在同一集合中,以保证分析结果的有效性。4.如权利要求1所述的一种基于访问信息挖掘的民航报文相关性分析方法,其特征是,所述步骤3)的最小支持度范围为O. 0...
【专利技术属性】
技术研发人员:宋雪雁,黄兆桐,孙济洲,李志增,于翠玲,
申请(专利权)人:天津大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。