基于大数据分析的交通线路到站归属地自动判定方法技术

技术编号:39829300 阅读:28 留言:0更新日期:2023-12-29 16:06
本发明专利技术提供基于大数据分析的交通线路到站归属地自动判定方法,该方法通过获取交通线路的到站名,进行处理得到地名列表,与全国行政区划代码数据库进行匹配,得到代码列表及名称列表;同时获取乘车人员的地址码前四位和前六位,得到对应列表及人数;将六位代码列表与前六位列表进行匹配判断,得到归属地;若六位代码列表为空,将地名列表进行处理得到过滤列表;若过滤列表不为空,根据前四位列表和地图地名搜索进行条件判断,得到归属地,若过滤列表为空,输出归属地判定结果为失败

【技术实现步骤摘要】
基于大数据分析的交通线路到站归属地自动判定方法


[0001]本专利技术涉及大数据分析领域,具体为基于大数据分析的交通线路到站归属地自动判定方法


技术介绍

[0002]在交通线路中,特别是大巴车的到站名,是由车站运营方人员人工自行录入

手动录入的名称有可能是某个市名,也可能是具体的某个街道





村或者地名等

由于地名存在极大程度的重名性,特别在四级乡级行政区内尤为常见

录入的到站名格式不一,有可能出现括号进行详细地名描述,也可能是需进行中途需要换乘的路线

为此,在大数据分析过程中,无法直接根据到站名进行人员迁徙分析

急需通过一个方法,对到站名进行统一格式化,并自动判定交通线路到站名的省市归属地


技术实现思路

[0003]鉴于以上所述现有技术的缺点,本专利技术提供一种基于大数据分析的交通线路到站归属地自动判定方法,以解决上述技术问题
...

【技术保护点】

【技术特征摘要】
1.
基于大数据分析的交通线路到站归属地自动判定方法,其特征在于,所述方法包括以下步骤:
S1
:获取交通线路的到站名,并对所述到站名进行文本特殊分割处理,获取到站名分割后的地名列表;
S2
:根据所述地名列表与全国行政区划代码数据库进行全字匹配和多字最左匹配,得到匹配后的行政区划代码前四位市级列表及其对应的市级行政区划名称列表

行政区划代码前六位区县级列表及其对应的区县级行政区划名称列表;
S3
:获取出行大数据内乘坐所述交通线路所有人员的地址码前四位和前六位,并进行按地址码前四位和前六位进行分组计数,得到前四位列表及前四位人数列表

前六位列表及前六位人数列表;
S4
:若所述行政区划代码前六位区县级列表不为空,将所述行政区划代码前六位区县级列表与前六位列表进行匹配判断,得到所述到站名的归属地;
S5
:若所述行政区划代码前六位区县级列表为空,将所述地名列表进行地名特殊过滤,得到过滤地名列表;
S6
:若过滤地名列表不为空,根据前四位列表和地图地名搜索进行条件判断,得到所述到站名的归属地,若所述过滤地名列表为空,输出所述到站名的归属地判定结果为失败
。2.
根据权利要求1所述的基于大数据分析的交通线路到站归属地自动判定方法,其特征在于,所述获取交通线路的到站名,并对所述到站名进行文本特殊分割处理,具体包括:
S11
:根据所述到站名进行小括号

中括号匹配,若成功匹配,则将括号内外的文字都作为单独地名,并添加到所述地名列表内;若匹配不到,将所述到站名添加到所述地名列表内;
S12
:根据所述地名列表内的所述到站名,进行预设的关键词匹配,若成功匹配,则取出所述到站名,并将关键词前后的文字作为单独地名添加回所述地名列表内
。3.
根据权利要求1所述的基于大数据分析的交通线路到站归属地自动判定方法,其特征在于,多字最左匹配的具体逻辑为:所述到站名的字符数大于或等于二,将匹配到的地名与所述到站名左侧对齐,且从左至右的字符依次相等
。4.
根据权利要求1所述的基于大数据分析的交通线路到站归属地自动判定方法,其特征在于,所述地址码根据全国行政区划代码数据库生成,所述地址码的前六位为对应居住地的行政区划编码,其中,所述地址码第一

二位是居住地所在省

自治区或直辖市的编码;所述地址码第三

四位是居住地所在市的编码;所述地址码第五<...

【专利技术属性】
技术研发人员:周耿城张清枝
申请(专利权)人:中运科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1