一种基于烟花算法的交通路线确定方法及系统技术方案

技术编号:18445139 阅读:26 留言:0更新日期:2018-07-14 10:28
本发明专利技术公开了一种基于烟花算法的交通路线确定方法及系统。所述方法包括:获取乘客出行数据集,乘客出行数据集包括多个区域内乘客的出行路线;统计数据库中每一个出行路线的出现次数;对出现次数进行排序;获取频繁一项集列表,频繁一项集列表是由出现次数大于最小出现次数的出行路线组成的;依据区域类别对频繁一项集列表进行分组,得到多个频繁一项集组;依据频繁一项集组构建频繁模式树;利用烟花算法删除频繁模式树中的干扰路线,得到条件子树,干扰路线为出行路线的换乘站数小于预设换乘站数的路线,条件子树表示出行路线之间的关联关系;根据关联关系确定交通路线。本发明专利技术能够快速地实现对交通路线的关联挖掘,提高交通路线确定的效率。

A traffic route determination method and system based on fireworks algorithm

The invention discloses a traffic route determination method and system based on fireworks algorithm. The methods include: obtaining the passenger travel data set, the passenger travel data set includes the passengers' travel routes in multiple regions; the number of occurrences of each trip route in the statistical database; sorting the number of occurrences; obtaining frequent list of sets, and frequent occurrence of a list is greater than the minimum number of occurrences. According to the area category, the frequent set lists are grouped and multiple sets of frequent sets are obtained; frequent pattern trees are built on a frequent set of sets; the interference routes in the frequent pattern trees are deleted by using the fireworks algorithm, and the conditional subtrees are obtained. The number of transfer stations with the interference route for the trip route is less than the precondition. When the number of transfer stations is set, the conditional subtree represents the relationship between the trip routes, and determines the traffic route according to the relationship. The invention can rapidly realize the association mining of the traffic route and improve the efficiency of the determination of the traffic route.

【技术实现步骤摘要】
一种基于烟花算法的交通路线确定方法及系统
本专利技术涉及数据挖掘
,特别是涉及一种基于烟花算法的交通路线确定方法及系统。
技术介绍
随着计算机技术的迅速发展,1993年R.Agrawal等人在对市场购物篮问题的调查分析研究中,首次提出了用关联规则表达式得到规则知识。关联规则提取的主要目标是发现数据项集之间内涵的关联或依赖关系,即从大量积累的数据中找出隐藏的数据模式或者知识。目前,通常采用关联规则的挖掘算法实现对交通路线的确定,即通过关联规则的挖掘算法对交通路线进行关联挖掘,通过分析居民的出行需求,得到交通路线的规划。先验性算法是现有的关联规则的挖掘算法之一,该算法需要多次扫描数据库,内存消耗大,在大数据量上挖掘十分耗时,导致挖掘效率不高。将先验性算法用于交通路线的确定,不能快速地实现对交通路线的关联挖掘,导致交通路线确定的效率不高。
技术实现思路
基于此,有必要提供一种基于烟花算法的交通路线确定方法及系统,以快速地实现对交通路线的关联挖掘,提高交通路线确定的效率。为实现上述目的,本专利技术提供了如下方案:一种基于烟花算法的交通路线确定方法,包括:获取乘客出行数据集,所述乘客出行数据集包括多个区域内乘客的出行路线;统计数据库中每一个所述出行路线的出现次数;对所述出现次数进行排序;获取频繁一项集列表,所述频繁一项集列表是由出现次数大于最小出现次数的所述出行路线组成的;依据所述区域类别对所述频繁一项集列表进行分组,得到多个频繁一项集组;依据所述频繁一项集组构建频繁模式树;利用烟花算法删除所述频繁模式树中的干扰路线,得到条件子树,所述干扰路线为所述出行路线的换乘站数小于预设换乘站数的路线,所述条件子树表示所述出行路线之间的关联关系;根据所述关联关系确定交通路线。可选的,所述利用烟花算法删除所述频繁模式树中的干扰路线,得到条件子树,具体包括:自底向上搜索频繁模式树,得到多个频繁子树,每个频繁子树包括多条路径,每条所述路径表示一条所述出行路线;判断每条所述路径对应的所述出行路线的适应度函数是否大于1;若是,则将所述路径的标记为0,表示保留所述路径,得到保留路径;若否,则将所述路径标记为1,表示删除所述路径;通过所述保留路径构建条件子树。可选的,所述方法中所述适应度函数是依据支持度和置信度确定的,具体为其中,i=1,2,...,n,fitnessi表示第i条出行路线的适应度函数,Supporti表示第i条出行路线的支持度;Confidencei表示第i条出行路线的置信度;MinSupport表示最小支持度;MinConfidence表示最小置信度。本专利技术还提供了一种基于烟花算法的交通路线确定系统,所述系统包括:数据集获取模块,用于获取乘客出行数据集,所述乘客出行数据集包括多个区域内乘客的出行路线;统计模块,用于统计数据库中每一个所述出行路线的出现次数;排序模块,用于对所述出现次数进行排序;频繁一项集列表获取模块,用于获取频繁一项集列表,所述频繁一项集列表是由出现次数大于最小出现次数的所述出行路线组成的;频繁一项集组获取模块,用于依据所述区域类别对所述频繁一项集列表进行分组,得到多个频繁一项集组;频繁模式树构建模块,用于依据所述频繁一项集组构建频繁模式树;条件子树获取模块,用于利用烟花算法删除所述频繁模式树中的干扰路线,得到条件子树,所述干扰路线为所述出行路线的换乘站数小于预设换乘站数的路线,所述条件子树表示所述出行路线之间的关联关系;交通路线确定模块,用于根据所述关联关系确定交通路线。可选的,所述条件子树获取模块,具体包括:频繁子树获取单元,自底向上搜索频繁模式树,得到多个频繁子树,每个频繁子树包括多条路径,每条所述路径表示一条所述出行路线;判断单元,用于判断每条所述路径对应的所述出行路线的适应度函数是否大于1;第一标记单元,用于当所述适应度函数大于1时,则将所述路径标记为0,表示保留所述路径,得到保留路径;第二标记单元,用于当所述适应度函数小于1时,则将所述路径标记为1,表示删除所述路径;条件子树构建单元,用于通过所述保留路径构建条件子树。可选的,所述系统中所述适应度函数是依据支持度和置信度确定的,具体为其中,i=1,2,...,n,fitnessi表示第i条出行路线的适应度函数,Supporti表示第i条出行路线的支持度;Confidencei表示第i条出行路线的置信度;MinSupport表示最小支持度;MinConfidence表示最小置信度。与现有技术相比,本专利技术的有益效果是:本专利技术提出了一种基于烟花算法的交通路线确定方法及系统,所述方法包括:获取乘客出行数据集,乘客出行数据集包括多个区域内乘客的出行路线;统计数据库中每一个出行路线的出现次数;对出现次数进行排序;获取频繁一项集列表,频繁一项集列表是由出现次数大于最小出现次数的出行路线组成的;依据区域类别对频繁一项集列表进行分组,得到多个频繁一项集组;依据频繁一项集组构建频繁模式树;利用烟花算法对频繁模式树进行剪枝,得到条件子树,条件子树表示出行路线之间的关联关系;根据关联关系确定交通路线。该方法利用烟花算法对频繁模式树进行剪枝,能够快速地实现对交通路线的关联挖掘,提高交通路线确定的效率,并且还能减少在挖掘过程中关联规则的遗漏。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例一种基于烟花算法的交通路线确定方法的流程图;图2为本专利技术实施例一种基于烟花算法的交通路线确定系统的结构图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。图1为本专利技术实施例一种基于烟花算法的交通路线确定方法的流程图。参见图1,实施例的基于烟花算法的交通路线确定方法,包括:步骤S1:获取乘客出行数据集,所述乘客出行数据集包括多个区域内乘客的出行路线。步骤S2:统计数据库中每一个所述出行路线的出现次数。步骤S3:对所述出现次数进行排序。步骤S4:获取频繁一项集列表,所述频繁一项集列表是由出现次数大于最小出现次数的所述出行路线组成的。步骤S5:依据所述区域类别对所述频繁一项集列表进行分组,得到多个频繁一项集组。步骤S6:依据所述频繁一项集组构建频繁模式树。步骤S7:利用烟花算法删除所述频繁模式树中的干扰路线,得到条件子树,所述干扰路线为所述出行路线的换乘站数小于预设换乘站数的路线,所述条件子树表示所述出行路线之间的关联关系。所述条件子树的具体构建过程如下:自底向上搜索频繁模式树,得到多个频繁子树,每个频繁子树包括多条路径,每条所述路径表示一条所述出行路线;判断每条所述路径对应的所述出行路线的适应度函数是否大于1;若是,则将所述路径的标记为0,表本文档来自技高网...

【技术保护点】
1.一种基于烟花算法的交通路线确定方法,其特征在于,包括:获取乘客出行数据集,所述乘客出行数据集包括多个区域内乘客的出行路线;统计数据库中每一个所述出行路线的出现次数;对所述出现次数进行排序;获取频繁一项集列表,所述频繁一项集列表是由出现次数大于最小出现次数的所述出行路线组成的;依据所述区域类别对所述频繁一项集列表进行分组,得到多个频繁一项集组;依据所述频繁一项集组构建频繁模式树;利用烟花算法删除所述频繁模式树中的干扰路线,得到条件子树,所述干扰路线为所述出行路线的换乘站数小于预设换乘站数的路线,所述条件子树表示所述出行路线之间的关联关系;根据所述关联关系确定交通路线。

【技术特征摘要】
1.一种基于烟花算法的交通路线确定方法,其特征在于,包括:获取乘客出行数据集,所述乘客出行数据集包括多个区域内乘客的出行路线;统计数据库中每一个所述出行路线的出现次数;对所述出现次数进行排序;获取频繁一项集列表,所述频繁一项集列表是由出现次数大于最小出现次数的所述出行路线组成的;依据所述区域类别对所述频繁一项集列表进行分组,得到多个频繁一项集组;依据所述频繁一项集组构建频繁模式树;利用烟花算法删除所述频繁模式树中的干扰路线,得到条件子树,所述干扰路线为所述出行路线的换乘站数小于预设换乘站数的路线,所述条件子树表示所述出行路线之间的关联关系;根据所述关联关系确定交通路线。2.根据权利要求1所述的一种基于烟花算法的交通路线确定方法,其特征在于,所述利用烟花算法删除所述频繁模式树中的干扰路线,得到条件子树,具体包括:自底向上搜索频繁模式树,得到多个频繁子树,每个频繁子树包括多条路径,每条所述路径表示一条所述出行路线;判断每条所述路径对应的所述出行路线的适应度函数是否大于1;若是,则将所述路径的标记为0,表示保留所述路径,得到保留路径;若否,则将所述路径标记为1,表示删除所述路径;通过所述保留路径构建条件子树。3.根据权利要求2所述的一种基于烟花算法的交通路线确定方法,其特征在于,所述适应度函数是依据支持度和置信度确定的,具体为其中,i=1,2,...,n,fitnessi表示第i条出行路线的适应度函数,Supporti表示第i条出行路线的支持度;Confidencei表示第i条出行路线的置信度;MinSupport表示最小支持度;MinConfidence表示最小置信度。4.一种基于烟花算法的交通路线确定系统,其特征在于,所述系统包括:数据集获取模块,用于获取乘客出行数据集,所述乘客出行数据集包括多个...

【专利技术属性】
技术研发人员:王春枝潘尚叶志伟师恒王毅超宗欣露
申请(专利权)人:湖北工业大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1