一种高频人车关联异常的数据识别方法及系统技术方案

技术编号:34358210 阅读:18 留言:0更新日期:2022-07-31 07:00
本发明专利技术提供了一种高频人车关联异常的数据识别方法及系统,在多个不同时刻收集每一个乘客的于多种公共交通工具上的定位数据和时间数据组成的序列作为人车关联数据,将各个乘客的人车关联数据组成的集合作为人车关联数据集合,对人车关联数据集合进行时空变化处理得到人车关联量,对人车关联量进行异常搜索得到异常点集合,通过异常点集合得到异常轨迹,实现了快速在多个复杂的乘客的时间空间位移数据上搜索得到异常轨迹的有益效果。数据上搜索得到异常轨迹的有益效果。数据上搜索得到异常轨迹的有益效果。

A data recognition method and system of high frequency human vehicle correlation anomaly

【技术实现步骤摘要】
一种高频人车关联异常的数据识别方法及系统


[0001]本专利技术属于大数据处理领域,具体涉及一种高频人车关联异常的数据识别方法及系统。

技术介绍

[0002]异常识别是在各种人工智能落地应用技术中,利用时间及空间的数据进行特征的抽取和维度的转换,进而检测出数据中存在异常的数据分布特征。 在人口数量密集的大中型城市中,公共交通网络规模巨大且运输效率高,在登上各种公共交通工具的时候,乘客需要进行基于交通卡、行程卡打卡等的数据记录,可由此获取乘客的出行时间和定位坐标,进而识别出高频人车关联异常的数据。在申请号为CN201910526181.4的专利文献中公开了一种生物识别与车辆识别联合检测方法,尽管可以对人和车同时进行生物识别和车辆识别并将两个识别结果进行数据关联再通过任一识别手段进行单一确认身份,但是仍不能够对异常的运动轨迹进行有效的追踪。

技术实现思路

[0003]本专利技术的目的在于提出一种高频人车关联异常的数据识别方法及系统,以解决现有技术中所存在的一个或多个技术问题,至少提供一种有益的选择或创造条件。
[0004]本专利技术提供了一种高频人车关联异常的数据识别方法及系统,在多个不同时刻收集每一个乘客的于多种公共交通工具上的定位数据和时间数据组成的序列作为人车关联数据,将各个乘客的人车关联数据组成的集合作为人车关联数据集合,对人车关联数据集合进行时空变化处理得到人车关联量,对人车关联量进行异常搜索得到异常点集合,通过异常点集合得到异常轨迹。
[0005]为了实现上述目的,根据本专利技术的一方面,提供一种高频人车关联异常的数据识别方法,所述方法包括以下步骤:S100,在多个不同时刻,收集每一个乘客的于多种公共交通工具上的定位数据和时间数据组成的序列作为人车关联数据;S200,将各个乘客的人车关联数据组成的集合作为人车关联数据集合;S300,对人车关联数据集合进行时空变化处理,得到人车关联量;S400,对人车关联量进行异常搜索,得到异常点集合;S500,通过异常点集合得到异常轨迹。
[0006]进一步地,在S100,收集每一个乘客在多个不同时刻的于多种公共交通工具上的定位数据和时间数据组成的序列作为人车关联数据的方法为:在多个不同时刻获取乘客在公共交通工具上的定位坐标和对应的时刻分别作为定位数据和时间数据,再把该个乘客在各时刻的时间数据与定位数据按时间的先后顺顺序组成的序列作为该个乘客对应的人车关联数据,时间数据为时间的记录,定位数据为定位坐标的经纬度值,对每个乘客进行收集人车关联数据。
[0007]进一步地,在S200,将各个乘客的人车关联数据组成的集合作为人车关联数据集合的方法为:将多个不同的乘客对应的人车关联数据组成的集合作为人车关联数据集合,记人车关联数据集合为集合Dset,人车关联数据集合中元素的数量为n,人车关联数据集合中元素的序号为i,i∈[1,n],序号i与人车关联数据所述的乘客保持对应关系,人车关联数据集合中序号为i的人车关联数据为D(i);记所述多个不同时刻中时刻的数量为k,所述多个不同时刻中时刻的序号为d,d∈[1,k];人车关联数据D(i)为一个由k个元素组成的序列,其中D(i)中的每个元素对应一个时刻的时间数据与定位数据,D(i)中序号为d的元素为D(i,d),D(i,d)由其对应的时间数据t(i,d)与定位数据p(i,d)组成,定位数据p(i,d)中的经度值为long(i,d),定位数据p(i,d)中的纬度值为lat(i,d)。
[0008]进一步地,在S300,对人车关联数据集合进行时空变化处理,得到人车关联量的方法为:将人车关联数据集合作为矩阵Dmat,矩阵Dmat为k行n列的矩阵,矩阵Dmat中行的序号与所述多个不同时刻中各时刻的序号保持一致,矩阵Dmat中列的序号与Dset中元素的序号保持一致,Dmat中序号为i的列即为D(i),Dmat中列序号为i而行序号为d的元素即为D(i,d);根据矩阵Dmat,对人车关联数据集合进行时空变化处理,时空变化处理得到的结果是一个k行n列的矩阵记作Denr,进行时空变化处理的具体过程为:令矩阵Denr中行的序号与Dmat中行的序号保持一致,Denr中列的序号与Dmat中列的序号保持一致,记矩阵Denr中列序号为i而行序号为d的元素为Denr(i,d),Denr中的元素Denr(i,d)与Dmat中相同行序号列序号的元素D(i,d)保持对应关系,Denr(i,d)的数值的计算公式为:其中,Temp(i,d)表示矩阵Dmat中列序号为i而行序号为d的元素的时间数据t(i,d)在矩阵Dmat序号为i的列中各元素的时间数据的时间变化数值,Pos(i,d)表示矩阵Dmat中列序号为i而行序号为d的元素的定位数据p(i,d)在矩阵Dmat序号为d的行中各元素的定位数据的空间变化数值;Temp(i,d)的计算公式为:函数G()表示计算两个时间数据之间的时间的差距,且时间的差距的结果以秒计算,再经过无量纲化处理并取绝对值;以d

1表示序号d的前一个序号,t(i,d)对应的D(i,d)在矩阵Dmat中序号为i的列中行序号为d

1的元素D(i,d

1)对应的时间数据即为t(i,d

1),Pos(i,d)的计算公式为:函数E()表示计算两个定位数据之间的经纬度值的欧氏距离,欧氏距离的结果以米计算,再经过无量纲化处理并取绝对值;
以i

1表示序号i的前一个序号,p(i,d)对应的D(i,d)在矩阵Dmat中序号为d的行中列序号为i

1的元素D(i

1,d)对应的定位数据即为p(i

1,d);(得到人车关联量的有益效果是:现有的人车运动关联的方法中忽视了在时间维度上各个不同乘客的运动趋势之间的线性联系,使得各个乘客之间的潜在的异常不能够被数据挖掘出来,而在计算人车关联量的过程中,通过计算各元素的时间数据的时间变化数值与各元素的定位数据的空间变化数值之间的线性乘积,将各个乘客的时间空间数据之间的线性联系在矩阵上呈现出来,使得对乘客之间的潜在的异常的数据挖掘的计算成本降低)。
[0009]进一步地,在S400中,对人车关联量进行异常搜索,得到异常点集合的方法为:设置集合Tset作为用来收集异常的定位数据的集合,令集合Tset的初始值为空集;设置一个指针记作pivot(i,d),pivot(i,d)中的变量i和d与Denr(i,d)中的变量i和d表示的含义保持一致,pivot(i,d)即为指向Denr(i,d)的指针;获取Denr中各元素数值的算术平均值作为davg;所述对人车关联量进行异常搜索的具体步骤为:S401,获取Denr中数值最大的一个元素作为Denr(i,d)的初始值,再令pivot(i,d)在Denr中指向当前作为初始值的Denr(i,d);S402,获取pivot(i,d)指向的当前的Denr(i,d),获取在Denr中与当前的Denr(i,d)相邻(即上下左右)的元素,并记所述相邻本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种高频人车关联异常的数据识别方法,其特征在于,所述方法包括以下步骤:S100,在多个不同时刻,收集每一个乘客的于多种公共交通工具上的定位数据和时间数据组成的序列作为人车关联数据;S200,将各个乘客的人车关联数据组成的集合作为人车关联数据集合;S300,对人车关联数据集合进行时空变化处理,得到人车关联量;S400,对人车关联量进行异常搜索,得到异常点集合;S500,通过异常点集合得到异常轨迹。2.根据权利要求1所述的一种高频人车关联异常的数据识别方法,其特征在于,在S100,收集每一个乘客在多个不同时刻的于多种公共交通工具上的定位数据和时间数据组成的序列作为人车关联数据的方法为:在多个不同时刻获取乘客在公共交通工具上的定位坐标和对应的时刻分别作为定位数据和时间数据,再把该个乘客在各时刻的时间数据与定位数据按时间的先后顺顺序组成的序列作为该个乘客对应的人车关联数据,时间数据为时间的记录,定位数据为定位坐标的经纬度值,对每个乘客进行收集人车关联数据。3.根据权利要求1所述的一种高频人车关联异常的数据识别方法,其特征在于,在S200,将各个乘客的人车关联数据组成的集合作为人车关联数据集合的方法为:将多个不同的乘客对应的人车关联数据组成的集合作为人车关联数据集合,记人车关联数据集合为集合Dset,人车关联数据集合中元素的数量为n,人车关联数据集合中元素的序号为i,i∈[1,n],序号i与人车关联数据所述的乘客保持对应关系,人车关联数据集合中序号为i的人车关联数据为D(i);记所述多个不同时刻中时刻的数量为k,所述多个不同时刻中时刻的序号为d,d∈[1,k];人车关联数据D(i)为一个由k个元素组成的序列,其中D(i)的每个元素对应一个时刻的时间数据与定位数据,D(i)中序号为d的元素为D(i,d),D(i,d)由其对应的时间数据t(i,d)与定位数据p(i,d)组成,定位数据p(i,d)中的经度值为long(i,d),定位数据p(i,d)中的纬度值为lat(i,d)。4.根据权利要求3所述的一种高频人车关联异常的数据识别方法,其特征在于,在S300,对人车关联数据集合进行时空变化处理,得到人车关联量的方法为:将人车关联数据集合作为矩阵Dmat,矩阵Dmat为k行n列的矩阵,矩阵Dmat中行的序号与所述多个不同时刻中各时刻的序号保持一致,矩阵Dmat中列的序号与Dset中元素的序号保持一致,Dmat中序号为i的列即为D(i),Dmat中列序号为i而行序号为d的元素即为D(i,d);根据矩阵Dmat,对人车关联数据集合进行时空变化处理,时空变化处理得到的结果是一个k行n列的矩阵记作Denr,进行时空变化处理的具体过程为:令矩阵Denr中行的序号与Dmat中行的序号保持一致,Denr中列的序号与Dmat中列的序号保持一致,记矩阵Denr中列序号为i而行序号为d的元素为Denr(i,d),Denr中的元素Denr(i,d)与Dmat中相同行序号列序号的元素D(i,d)保持对应关系,Denr(i,d)的数值的计算公式为:
其中,Temp(i,d)表示矩阵Dmat中列序号为i而行序号为d的元素的时间数据t(i,d)在矩阵Dmat序号为i的列中各元素的时间数据的时间变化数值,Pos(i,d)表示矩阵Dmat中列序号为i而行序号为d的元素的定位数据p(i,d)在矩阵Dmat序号为d的行中各元素的定位数据的空间变化数值;Temp(i,d)的计算公式为:,函数G()表示计算两个时间数据之间的时间的差距;Pos(i,d)的计算公式为:,函数E()表示计算两个定位数据之间的经纬度值的欧氏距离。5.根据权利要求4所述的一种高频人车关联异常的数据识别方...

【专利技术属性】
技术研发人员:陈明晖谭玉珍彭祖怡黎健田剑
申请(专利权)人:湖南智警公共安全技术研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1