The invention discloses an automatic detection method for ground bus pick pocketing based on supervised learning. In view of the lack of a set of effective intelligent traffic data analysis methods in the public traffic safety supervision, this invention adopts the large data of public transportation and the effective data of social network, and proposes a method of automatic detection of ground bus pickpocket based on supervised classification. The following steps are included: Step 1: extracting key characteristics of abnormal trip; step 2: cluster analysis embedded in pickpocket group; step 3: Construction of pickpocket individual sample base; step 4: pickpocket individual has a supervised classification. The automatic detection method of ground bus pickpocket can be applied to the data analysis platform of public transportation industry to provide scientific basis for pickpocket individual detection, pickpocket event early warning and visual distribution control.
【技术实现步骤摘要】
一种基于监督学习的地面公交扒窃个体自动检测方法
本专利技术属于公共交通异常检测领域,尤其涉及一种基于监督学习的地面公交扒窃个体自动检测方法。
技术介绍
人流密集且流动频繁的公共交通场所极易滋生扒窃事件,在高峰时间、热点区域处尤为严重。有效打击场所内的扒窃事件是保障公共交通安全运营的重要途径。虽然短期警力投入能够显著抑制扒窃事件的发生,但仍不能从源头上有效遏制其发展态势。究其原因,尚缺乏一套有效的地面公交扒窃个体自动检测方法。历年针对公共交通异常检测的专利主要是以硬件报警设施为主。例如,申请号为200820052528.3的专利公开了一种公共客运车和轨道客运列车车厢防盗语音报警器的技术,可在个体发现扒手时触发使用。但是这类专利技术通常只适用于事中报警,未考虑报警后车厢内产生的个体骚动、扒窃反击等安全隐患,也无法提前预警异常事件。近年来,大数据的采集为自动检测异常个体提供数据驱动支持。与传统的基于硬件设施报警检测异常个体的方法不同,基于大数据驱动的异常检测方法是在历史数据的基础上,通过训练历史工作模式,应用于现有工作模式的学习中。这类方法能够提前检测显著偏离于正常模式 ...
【技术保护点】
一种基于监督学习的地面公交扒窃个体自动检测方法,其特征在于,包括以下步骤:步骤1:分别从空间、时间和属性维度提取多个表示扒窃个体出行的特征指标;其中,空间维度的异常出行关键特征包含:隐患站点个数(abStas)和站点片区熵值(staZnEn),时间维度的异常出行关键特征包含:站点时间熵值(staTmEn)和高峰时段访问频率(peakTmPct),属性维度的异常出行关键特征包含:频繁出行频率(freTraPct)、最频繁出行路径比重(maxODPct)、短途出行比重(shortTraPct);步骤2:嵌入扒窃组别的聚类分析步骤2.1:扒窃组别细分。根据扒窃先验知识可知,扒窃个 ...
【技术特征摘要】
1.一种基于监督学习的地面公交扒窃个体自动检测方法,其特征在于,包括以下步骤:步骤1:分别从空间、时间和属性维度提取多个表示扒窃个体出行的特征指标;其中,空间维度的异常出行关键特征包含:隐患站点个数(abStas)和站点片区熵值(staZnEn),时间维度的异常出行关键特征包含:站点时间熵值(staTmEn)和高峰时段访问频率(peakTmPct),属性维度的异常出行关键特征包含:频繁出行频率(freTraPct)、最频繁出行路径比重(maxODPct)、短途出行比重(shortTraPct);步骤2:嵌入扒窃组别的聚类分析步骤2.1:扒窃组别细分。根据扒窃先验知识可知,扒窃个体在freTraPct和maxODPct指标上呈现出与正常个体截然不同的分布特性,当某一个体:·freTraPct>0.05,为出行频繁个体;·maxODPct>0.3,为拥有最频繁使用路径的个体;根据上述两个指标将全部个体归至G1、G3、G5、G7组别,G1组可表示出行频率高并且有最频繁使用路径的个体,其他组别个体的出行特性依以此类推:a)G1:freTraPct>0.05及maxODPct>0.3;b)G3:freTraPct≤0.05及maxODPct>0.3;c)G5:freTraPct>0.05及maxODPct≤0.3;d)G7:freTraPct≤0.05及maxODPct≤0.3;步骤2.2:无监督式聚类分析选用基于划分思想的k-means++方法对上述4类组别个体进行聚类,选取k-means++聚集个体的关键出行特征,将具有相近移动模式的个体化为一类,为标定扒窃个体提供便利;如果某类中仅包含异常样本,则称其为纯异常类,否则为复合类;步骤2.3:聚类效果评估k-means++算法收敛的条件是所有类内个体移动模式的累积相异度最小,具体可用聚类评估指标SSE进行量化表征,SSE的计算公式见式(3),式中,x是第i类的任一样本点,代表第i类移动模式类别下的任一个体的出行特征序列;ci是第i类的质心,代表第i类移动模式类别下的典型出行特征序列;dist(x,ci)是x和ci的欧式距离,代表第i类移动模式类别下所选个体的出行特征序列与典型出行特征序列的相异度,k-means++算法需要预设聚类数目k,该值达到最优的条件是所有类内个体移动模式的累积相异度最小,且所有类间个体移动模式的累积相异度最大,类内累积相异度可用SSE表示,而类间累积相异度可用聚类评估指标SSB量化表示,SSB是指所有类的类内质心与全体数据集质心的欧式距离的累积和,SSB与类间分离度成正比,SSB的计算公式见式(4),式中,c是全体数据集的质心,代表全体个体的典型出行特征序列;mi是第i类的类内样本个数,代表第i类移动模式类别下所有个体的数目,步骤3:扒窃个体样本库构建首先采用ROCF算子判别任一类异常性,如果是纯异常类,则将类内个体全部标记为异常个体,否则,继续从中筛选潜在异常个体,采用LOF算子逐一识别出异常个体;最后采用社交网络数据验证异常个体的真实性,实现扒窃个体样本库的构建;步骤4:基于所构建的扒窃个体样本库,采用有监督式分类方法自动检测数据集中的扒窃个体。2.如权利要求1所述的基于监督学习的地面公交扒窃个体自动检测方法,其特征在于,步骤3中基于特征分布的潜在异常个体筛选如下:某个体成为潜在异常个体的...
【专利技术属性】
技术研发人员:尹宝才,赵霞,张勇,张可,王文婷,
申请(专利权)人:北京工业大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。