一种微博舆情与城市路况相映射的交通平行方法技术

技术编号:14558332 阅读:133 留言:0更新日期:2017-02-05 12:47
本发明专利技术提供一种微博舆情与城市路况相映射的交通平行方法,该方法包括:实时采集获取针对特定城市的交通信息主题的微博消息数据;对获取的每条微博信息:a.对微博的原始属性与映射属性分别进行形式化表达;b.根据交通主题分类数据集对其设定类别属性;c.根据城市道路数据集,抽取其地理位置信息;对于交通反馈类信息,抽取微博中反馈的特定主题;d.根据抽取的基础属性信息计算每条微博的相关指数,包括可信度、情感度和重要度。通过本发明专利技术可以实现对微博中的交通信息进行快速分类与定位,实现基于互联网信息交通事故、拥堵、反馈类信息进行预警可视化展示,为城市交通管理、规划、应急预案、问题解决等提供辅助决策。

Traffic parallel method for mapping micro-blog public opinion and urban road condition

The invention provides a micro-blog public opinion and the city road traffic mapping parallel method, the method includes: micro-blog news data real-time traffic information in a specific city; for each micro-blog information: A. on micro-blog's original attribute and attribute mapping were formal expression; B. subject classification according to the traffic data set the category attributes of the C.; according to city road data set, extract the information of its geographical location; for traffic feedback information, subject specific feedback from micro-blog in the calculation of each index D.; micro-blog according to the extracted basic attribute information, including credibility, emotional degree and importance degree. The invention can achieve fast classification and location of traffic information in micro-blog Internet information, realize the traffic accident and congestion feedback information visualization based on early warning, to provide decision support for city planning, traffic management, emergency plan, problem solving etc..

【技术实现步骤摘要】

本专利技术涉及本专利技术属于互联网数据处理
,具体地,涉及一种微博舆情与城市路况相映射的交通平行方法
技术介绍
目前主要的交通数据采集技术包括固定式传感器采集、浮动车采集以及移动感知采集。固定式传感器技术利用安装在道路上或铺设再道路中的传感器节点组成传感器网络对交通数据进行定点采集,但一般存在对安装场所和环境的依赖,面临初期投资巨大、生命周期短、维护成本高等问题。浮动车技术主要利用再路网中行驶的浮动车(出租车、自行车等)采集自身行驶时的GPS估计数据并上传到服务器。但也存在投入大,缺乏其他种类车辆的数据以及出租车等的行驶数据并不一定能反映真是路况等问题。随着移动互联网和移动智能手持设备的普及,基于众包的移动感知技术被随之提出。目前,国内外对基础移动感知技术对路况数据提取的研究,主要集中再基于手机网络定位技术以及基于终端传感器定位技术的实时交通信息提取研究。两种技术也分别存在网络定位精度低、采集频率不固定以及人为触发和监控导致用户感知负担增加等问题。随着互联网的不断发展,使得以在线社区、博客、微博、社交网站、视频共享网站等为代表的社会媒体迅速普及,网民的互动参与,使网络空间变得与物理“真实世界”逐渐趋于一致。由于社会媒体发布信息的易用性和时效性极高,使得人们发布共享各类信息变得无比便捷。如在2012年伦敦奥运会时,伦敦交通局就发布了一款叫做TubeStar的应用,它通过监测乘客在Twitter所发布的消息,及时获取到了大量用户乘坐公共交通旅行时的感受和情况,例如哪里交通拥挤,哪里发生交通事故等。当前网络已经成为大众反应问题,反应诉求的一个重要窗口,通过浏览互联网不难发现,其中充斥着大量对交通管理工作中出现的问题的投诉和建议。其中微博平台由于其参与人数多、更新速度快、用户分布广等特点,存在大量用户实时发布的交通信息,包括对交通事故的现场描述、交通拥堵的评价、交通设施的问题反馈等各类信息。如何及时获取这些信息,正确处理后进行交通主题分类,并从中分析抽取相关地理位置信息并计算相关指数,通过有效的可视化方法进行展示,实现从微博舆情到交通问题映射,进而辅助相关交通管理部门在传统数据采集方法之外对相关路况等数据的补充验证等,也是当前交通数据采集急需解决的一个问题。
技术实现思路
为了解决上述问题,本专利技术提供一种微博舆情与城市路况相映射的交通平行方法,其具体的技术方案如下:一种微博舆情与城市路况相映射的交通平行方法,该方法包括以下步骤:步骤一、根据设定城市中各路段名称、路段级别、交叉路集、两侧建筑物集、路段起点经纬度坐标、路段终点经纬度坐标建立城立路段数据集JRD;步骤二、实时采集设定的城市交通信息主题相关的微博,根据主题相关和时间窗口范围判断其有效性,对于一条有效的微博记作JMB;步骤三、对于每一条JMB,建立其原始数据集,抽取其原始属性,记作JMB_original;步骤四、对原始数据集进行处理抽取,建立与原始数据集形成映射的属性集,记作:JMB_processed;步骤五、自定义时间窗口,建立自定义时间窗口内的交通主题数据集JCD;其中事故类数据集记为Set_accident,拥堵类数据集记为Set_jam,反馈类数据集记为Set_feedback;对于每条微博信息JMB,根据其所属路段与交通主题类别加入对应的自定义时间窗口内的数据集中;对于Set_accident与Set_feedback,实时信息动态更新;对于Set_jam,更新所属路段的拥堵指数;步骤六、对JMB_processed中的部分属性信息,以及更新后的三类交通主题数据集Set_accident,Set_jam以及Set_feedback,根据城市道路数据集JRD中相关路段的起始点经纬度坐标值和地点信息分别以不同的方式在地图中进行实时可视化显示。进一步,步骤三中,JMB采用向量形式表达,具体如下:JMB_original=(Publisher,PTime,Content,Ptemi,Cnt_forward,Cnt_comment,Cnt_like,Cnt_pic,Plocation,Emoticon),其中Publisher为该条微博的发布者,同时会采集相关属性,包括账号类型Publisher_type、博主名称Publisher_name、博主所在地Publisher_city、博主粉丝数Publisher_fanscnt;T_publish为本条微博发布时间;Content为本条微博文本内容;Ptemi为本条微博发布客户端;Cnt_forward为本条微博转发数,且Cnt_forward≥0;Cnt_comment为本条微博评论数,且Cnt_comment≥0;Cnt_like为本条微博点赞数,且Cnt_like≥0;Cnt_pic为本条微博包含的图片数,且Cnt_pic≥0;Plocation为本条微博包含的发布地点;Emoticon为本条微博包含的表情符号;进一步,步骤四中,JMB_processed的具体表达形式如下:JMB_processed=(Category,Road_name,Road_type,Location_name,Location_type,Index_emotion,Target,Index_reliability,Index_influence),其中Category为本条微博JMB的所属交通主题类别,其取值为交通分类数据集中包含的类别,取值范围为[交通事故、交通拥堵与交通反馈];Road_name为本条微博包含的城市路段名称,取值范围为对应城市交通道路数据集中的道路;Road_type为本条微博包含的城市路段名称,取值范围为对应城市交通道路数据集中的道路级别;Location_name为本条微博包含的具体地理位置名称;Location_type为本条微博包含的具体地理位置类别,取值范围为1代表道路交叉口,2代表道路旁的建筑物;Target为交通反馈类微博反馈的交通主题,取值范围为[信号灯、交通标线、交通标志、交通护栏、监控设备];Index_emotion为本条微博的情感度得分,取值范围为整数集Z;Index_reliability为本条微博的可信度得分,且Index_reliability≥0;Index_importance为本条微博的重要度得分,且Index_importance≥0。进一步,步骤四中,JMB_processed的属性信息按如下方式取得:S1,判定分类:对于实时采集的一条有效微博JMB,根据对其文本内容进行自然语言分词后的词组以及构建的城市交通主题分类数据集JCD判定其所属的交通主题类别,设定JMB_processed中的Category。S2,地理信息抽取:对于每条微博信息JMB,根据其基础属性集合JMB_original中的相关字段以及构建的城市道路数据集JRD,抽取其本文档来自技高网
...

【技术保护点】
一种微博舆情与城市路况相映射的交通平行方法,其特征在于,该方法包括以下步骤:步骤一、根据设定城市中各路段名称、路段级别、交叉路集、两侧建筑物集、路段起点经纬度坐标、路段终点经纬度坐标建立城立路段数据集JRD;步骤二、实时采集设定的城市交通信息主题相关的微博,根据主题相关和时间窗口范围判断其有效性,对于一条有效的微博记作JMB;步骤三、对于每一条JMB,建立其原始数据集,抽取其原始属性,记作JMB_original;步骤四、对原始数据集进行处理抽取,建立与原始数据集形成映射的属性集,记作:JMB_processed;步骤五、自定义时间窗口,建立自定义时间窗口内的交通主题数据集JCD;其中事故类数据集记为Set_accident,拥堵类数据集记为Set_jam,反馈类数据集记为Set_feedback;对于每条微博信息JMB,根据其所属路段与交通主题类别加入对应的自定义时间窗口内的数据集中;对于Set_accident与Set_feedback,实时信息动态更新;对于Set_jam,更新所属路段的拥堵指数;步骤六、对JMB_processed中的部分属性信息,以及更新后的三类交通主题数据集Set_accident,Set_jam以及Set_feedback,根据城市道路数据集JRD中相关路段的起始点经纬度坐标值和地点信息分别以不同的方式在地图中进行实时可视化显示。...

【技术特征摘要】
1.一种微博舆情与城市路况相映射的交通平行方法,其特征在于,该方法包括以下步骤:
步骤一、根据设定城市中各路段名称、路段级别、交叉路集、两侧建筑物集、路段起点经纬度坐标、路段终点经纬度坐标建立城立路段数据集JRD;
步骤二、实时采集设定的城市交通信息主题相关的微博,根据主题相关和时间窗口范围判断其有效性,对于一条有效的微博记作JMB;
步骤三、对于每一条JMB,建立其原始数据集,抽取其原始属性,记作JMB_original;
步骤四、对原始数据集进行处理抽取,建立与原始数据集形成映射的属性集,记作:JMB_processed;
步骤五、自定义时间窗口,建立自定义时间窗口内的交通主题数据集JCD;其中事故类数据集记为Set_accident,拥堵类数据集记为Set_jam,反馈类数据集记为Set_feedback;对于每条微博信息JMB,根据其所属路段与交通主题类别加入对应的自定义时间窗口内的数据集中;对于Set_accident与Set_feedback,实时信息动态更新;对于Set_jam,更新所属路段的拥堵指数;
步骤六、对JMB_processed中的部分属性信息,以及更新后的三类交通主题数据集Set_accident,Set_jam以及Set_feedback,根据城市道路数据集JRD中相关路段的起始点经纬度坐标值和地点信息分别以不同的方式在地图中进行实时可视化显示。
2.根据权利要求1所述的一种微博舆情与城市路况相映射的交通平行方法,其特征在于,步骤三中,JMB采用向量形式表达,具体如下:
JMB_original=(Publisher,PTime,Content,Ptemi,Cnt_forward,Cnt_comment,Cnt_like,Cnt_pic,Plocation,Emoticon),其中
Publisher为该条微博的发布者,同时会采集相关属性,包括账号类型Publisher_type、博主名称Publisher_name、博主所在地Publisher_city、博主粉丝数Publisher_fanscnt;
T_publish为本条微博发布时间;
Content为本条微博文本内容;
Ptemi为本条微博发布客户端;
Cnt_forward为本条微博转发数,且Cnt_forward≥0;
Cnt_comment为本条微博评论数,且Cnt_comment≥0;
Cnt_like为本条微博点赞数,且Cnt_like≥0;
Cnt_pic为本条微博包含的图片数,且Cnt_pic≥0;
Plocation为本条微博包含的发布地点;
Emoticon为本条微博包含的表情符号。
3.根据权利要求1所述的一种微博舆情与城市路况相映射的交通平行方法,其特征在于,步骤四中,JMB_processed的具体表达形式如下:
JMB_processed=(Category,Road_name,Road_type,Location_name,Location_type,Index_emotion,Target,Index_reliability,Index_influence),其中
Category为本条微博JMB的所属交通主题类别,其取值为交通分类数据集中包含的类别,取值范围为[交通事故、交通拥堵与交通反馈];
Road_name为本条微博包含的城市路段名称,取值范围为对应城市交通道路数据集中的道路;
Road_type为本条微博包含的城市路段名称,取值范围为对应城市交通道路数据集中的道路级别;
Location_name为本条微博包含的具体地理位置名称;
Location_type为本条微博包含的具体地理位置类别,取值范围为1代表道路交叉口,2代表道路旁的建筑物;
Target为交通反馈类微博反馈的交通主题,取值范围为[信号灯、交通标线、交通标志、交通护栏、监控设备];
Index_emotion为本条微博的情感度得分,取值范围为整数集Z;
Index_reliability为本条微博的可信度得分,且Index_reliability≥0;
Index_importance为本条微博的重要度得分,且Index_importance≥0。
4.根据权利要求3所述的一种微博舆情与城市路况相映射的交通平行方法,其特征在于,步骤四中,JMB_processed的属性信息按如下方式取得:
S1,判定分类:对于实时采集的一条有效微博JMB,根据对其文本内容进行自然语言分词后的词组以及构建的城市交通主题分类数据集JCD判定其所属的交通主题类别,设定JMB_proce...

【专利技术属性】
技术研发人员:孙星恺陆浩袁勇王飞跃吕宏强关晓炟
申请(专利权)人:青岛智能产业技术研究院
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1