一种基于车联网数据的时空维度用户画像分析方法技术

技术编号:16038124 阅读:44 留言:0更新日期:2017-08-19 19:57
本发明专利技术提供一种基于车联网数据的时空维度用户画像分析方法,所述方法通过车联网时空数据的描述方法,得到车主在出行习惯方面的画像,进行对车主的出行规律度描述、运营性质车辆识别、自驾游喜好程度描述、社交喜好判断等方面的应用,通过对车主的用户画像丰富保险行业中从人因素的风险因子库,通过对特定车主身份的识别为行业用户提供实现精准营销、改善用户体验的数据基础,本发明专利技术可以直观地描述车主在空间维度的出行习惯,同时描述车主在时间维度的变化规律。同时结合对聚类点属性的反馈,可以判断车主的出行习惯,如同为自驾游爱好者推荐兴趣相投的伙伴,使用车联网的用户画像技术可以为更多的车主提供丰富多样的社交属性。

【技术实现步骤摘要】
一种基于车联网数据的时空维度用户画像分析方法
本专利技术属于车联网信息
,具体涉及一种基于车联网数据的时空维度用户画像分析方法。
技术介绍
随着移动互联网和物联网技术的发展,越来越多的车辆通过前装或后装的方式加入了车联网的阵营,并产生了大量的基于车辆位置的数据,然而这些数据的价值还有待进行更多维度、更深层次的挖掘。相关领域,国内外对于车联网数据的使用主要集中在使用车联网数据对不良驾驶行为的识别和预警,以及驾驶行为的经济性研究,而在基于车联网时空数据对用户行为进行深度挖掘的工作才刚刚起步。相关方面如中国专利技术专利申请201410531377.X公开的“基于物联网大数据平台的用户智能画像方法”,是通过物联网信息中心采集用户数据对用户进行定性和定量的分析,从而识别核心和规模较大的用户。又如201210074506.8公开的“基于手机定位数据的居民出行特征参数的获取方法”,是通过手机定位数据匹配到交通小区,这种方法对地图信息的依赖性强,且需要完备的交通小区信息。并且在该专利中也给出了判断居住地和工作地的简单方法,从而去判断用户的出行特征。
技术实现思路
为了解决上述问题,本专利技术提供一种基于车联网数据的时空维度用户画像分析方法,所述方法通过车联网时空数据的描述方法,得到车主在出行习惯方面的画像,进行对车主的出行规律度描述、运营性质车辆识别、自驾游喜好程度描述、社交喜好判断等方面的应用,通过对车主的用户画像丰富保险行业中从人因素的风险因子库,通过对特定车主身份的识别为行业用户提供实现精准营销、改善用户体验的数据基础;进一步地,所述方法包括:S1:OBD数据采集;S2:对S1采集的OBD数据进行清洗;S3:对S2清洗完的数据进行描述性统计;S4:对S3中的行程起点和终点坐标进行聚类;S5:对S4对车联网数据的时间维度描述;S6:对S5车联网数据的空间维度描述;进一步地,所述S1中OBD数据采集具体为:通过OBD盒子,对车辆CAN总线进行访问实时采集数据,所述数据具体为时间数据、GPS数据和车况数据;进一步地,所述S2中数据清洗具体为基于OBD采集数据时的工作状态所生成的位掩码,位掩码表示记录中所有字段的有效性,“1”标志为有效,“0”标志为无效,查找并分析其余的异常数据,对该数据出现的规律性进行分析,提出合理的清除数据或者修改异常数据的措施;进一步地,所述S3中描述性统计具体为对行程的统计表和对车主的统计表,所述统计表统计指标包括:行程起点、终点坐标、行程开始时间、结束时间、行程持续时间、行程结束停车时间和行程里程长度;进一步地,所述S4中终点聚类具体为以车主的家或公司形成点密度较大的核心分布区域,将属于所述核心分布区域进行定位点编号;进一步地,所述S5中对时间维度描述具体为将时间以较小的间隔离散化,记录车主在观测期内的所有行程,得到以下稀疏矩阵,矩阵中的第一列为日期(YYMMDD),第二列为星期(1\2\3\4\5\6\7),其余十二列为一天的12个时段。对应的12个时段内的标号,表示该车主行程起点和终点的编号;进一步地,所述S6中对车联网数据的空间维度描述具体为将车主每天的行程看作是一条连续聚类点组成的序列,将车主所有的行程并列在一起,其中,层级表示为车主在观测日期内的最长行程长度,模块的宽度表示该层级中到达该聚类点次数的占比,所有聚类点带有一个详细行程表,记录:到达次数、到达次数占比、到达行程开始时间、到达行程结束时间、出发行程开始时间、出发行程结束时间;本专利技术的有益效果如下:1)如同为自驾游爱好者推荐兴趣相投的伙伴,使用车联网的用户画像技术可以为更多的车主提供丰富多样的社交属性;2)可以直观地描述车主在空间维度的出行习惯,同时描述车主在时间维度的变化规律。同时结合对聚类点属性的反馈,可以判断车主的出行习惯;说明书附图图1为本专利技术S6中所述车联网数据的空间维度描述图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细描述。应当理解,此处所描述的具体实施例仅仅用于解释本专利技术,并不用于限定本专利技术。相反,本专利技术涵盖任何由权利要求定义的在本专利技术的精髓和范围上做的替代、修改、等效方法以及方案。进一步,为了使公众对本专利技术有更好的了解,在下文对本专利技术的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本专利技术。下面结合附图和具体实施例对本专利技术作进一步说明,但不作为对本专利技术的限定。下面为本专利技术的举出最佳实施例:一种基于车联网数据的时空维度用户画像分析方法,所述方法通过车联网时空数据的描述方法,得到车主在出行习惯方面的画像,进行对车主的出行规律度描述、运营性质车辆识别、自驾游喜好程度描述、社交喜好判断等方面的应用,通过对车主的用户画像丰富保险行业中从人因素的风险因子库,通过对特定车主身份的识别为行业用户提供实现精准营销、改善用户体验的数据基础,所述方法包括:S1:OBD数据采集;S2:对S1采集的OBD数据进行清洗;S3:对S2清洗完的数据进行描述性统计;S4:对S3中的行程起点和终点坐标进行聚类;S5:对S4对车联网数据的时间维度描述;S6:对S5车联网数据的空间维度描述,所述S1中OBD数据采集具体为:通过OBD盒子,对车辆CAN总线进行访问实时采集数据,所述数据具体为时间数据、GPS数据和车况数据。所述S2中数据清洗具体为基于OBD采集数据时的工作状态所生成的位掩码,位掩码表示记录中所有字段的有效性,“1”标志为有效,“0”标志为无效,查找并分析其余的异常数据,对该数据出现的规律性进行分析,提出合理的清除数据或者修改异常数据的措施。所述S3中描述性统计具体为对行程的统计表和对车主的统计表,所述统计表统计指标包括:行程起点、终点坐标、行程开始时间、结束时间、行程持续时间、行程结束停车时间和行程里程长度,所述S4中终点聚类具体为以车主的家或公司形成点密度较大的核心分布区域,将属于所述核心分布区域进行定位点编号,所述S5中对时间维度描述具体为将时间以较小的间隔离散化,记录车主在观测期内的所有行程,得到以下稀疏矩阵,矩阵中的第一列为日期(YYMMDD),第二列为星期(1\2\3\4\5\6\7),其余十二列为一天的12个时段。对应的12个时段内的标号,表示该车主行程起点和终点的编号,所述S6中对车联网数据的空间维度描述具体为将车主每天的行程看作是一条连续聚类点组成的序列,将车主所有的行程并列在一起,如图1所示,其中,层级表示为车主在观测日期内的最长行程长度,模块的宽度表示该层级中到达该聚类点次数的占比,所有聚类点带有一个详细行程表,记录:到达次数、到达次数占比、到达行程开始时间、到达行程结束时间、出发行程开始时间、出发行程结束时间。本专利技术所述的方法应用于以下模块:1)OBD数据采集模块基于OBD盒子,对车辆CAN总线进行访问实时采集数据。本专利中主要指采集到的时间数据、GPS数据、车况数据等。2)数据描述性统计模块将OBD采集到的数据发往服务器,并对这些数据进行清洗以及描述性的统计。需要特别强调的是,在进行车主驻留点的聚类方法及属性分析前应当对车主身份及其他敏感信息(如vin码、设备ID等)进行哈希加密,防止对车主产生不本文档来自技高网...
一种基于车联网数据的时空维度用户画像分析方法

【技术保护点】
一种基于车联网数据的时空维度用户画像分析方法,其特征在于,所述方法通过车联网时空数据的描述方法,得到车主在出行习惯方面的画像,进行对车主的出行规律度描述、运营性质车辆识别、自驾游喜好程度描述、社交喜好判断等方面的应用,通过对车主的用户画像丰富保险行业中从人因素的风险因子库,通过对特定车主身份的识别为行业用户提供实现精准营销、改善用户体验的数据基础。

【技术特征摘要】
1.一种基于车联网数据的时空维度用户画像分析方法,其特征在于,所述方法通过车联网时空数据的描述方法,得到车主在出行习惯方面的画像,进行对车主的出行规律度描述、运营性质车辆识别、自驾游喜好程度描述、社交喜好判断等方面的应用,通过对车主的用户画像丰富保险行业中从人因素的风险因子库,通过对特定车主身份的识别为行业用户提供实现精准营销、改善用户体验的数据基础。2.根据权利要求1所述的分析方法,其特征在于,所述方法包括:S1:OBD数据采集;S2:对S1采集的OBD数据进行清洗;S3:对S2清洗完的数据进行描述性统计;S4:对S3中的行程起点和终点坐标进行聚类;S5:对S4对车联网数据的时间维度描述;S6:对S5车联网数据的空间维度描述。3.根据权利要求2所述的分析方法,其特征在于,所述S1中OBD数据采集具体为:通过OBD盒子,对车辆CAN总线进行访问实时采集数据,所述数据具体为时间数据、GPS数据和车况数据。4.根据权利要求2所述的分析方法,其特征在于,所述S2中数据清洗具体为基于OBD采集数据时的工作状态所生成的位掩码,位掩码表示记录中所有字段的有效性,“1”标志为有效,“0”标志为无效,查找并分析其余的异常数据,对该数据出现的规律性进行分析,提出合理的清除数据或者修改异常数据...

【专利技术属性】
技术研发人员:侯志伟耿文童李旭
申请(专利权)人:北京车网互联科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1