【技术实现步骤摘要】
一种以采集频率与范围为权重的数据关联度计算方法
[0001]本专利技术涉及数据处理
,尤其涉及一种以采集频率与范围为权重的数据关联度计算方法。
技术介绍
[0002][0003]公开了申请号为CN202210063001.5的一种图码关联强度计算方法、装置、设备及存储介质,在预设区域内实时采集人脸图片和手机IMSI轨迹,生成人脸集合和IMSI集合;遍历人脸集合,得到目标人员的关联IMSI集合;遍历IMSI集合,得到目标手机的关联人脸集合;根据点式互信息计算人脸图片和手机IMSI的关联强度。
[0004]在上述的算法中,区域是预先设置的,不支持根据设备的采集范围进行动态调整,然而在实际应用中,每个设备因为制式的不同,其采集范围和采集频率都不一样;同时对数据去重时没有考虑设备的采集频率,会出现不是同一个采集周期内的数据被去重的情况,这会影响数据关联度计算结果的准确性。
技术实现思路
[0005]针对现有技术的不足,本专利技术提出了一种以采集频率与范围为权重的数据关联度计算方法,其目的是能够根据每个设 ...
【技术保护点】
【技术特征摘要】
1.一种以采集频率与范围为权重的数据关联度计算方法,其特征在于,所述方法包括:实时接入采集的原始轨迹数据A和原始轨迹数据B;对原始轨迹数据A进行分组处理;对原始轨迹数据A进行排序和批次划分,并去重;筛选得到目标设备采集范围内的原始轨迹数据B的关联设备;对原始轨迹数据B的关联设备采集的数据进行筛选,提取得到同一时间段范围内的数据集合;根据目标设备采集的数据和关联设备采集的数据,计算总关联度。2.如权利要求1所述的一种以采集频率与范围为权重的数据关联度计算方法,其特征在于,所述原始轨迹数据A和原始轨迹数据B为车辆轨迹数据、原始人脸图片数据和原始IMSI轨迹数据中的任意两种。3.如权利要求2所述的一种以采集频率与范围为权重的数据关联度计算方法,其特征在于,对原始轨迹数据A进行分组处理,具体包括:对原始轨迹数据A进行预处理,根据设备编号对所述原始轨迹数据A进行分组,分组后的数据集合记为A={A1,A2,...,A
n
};其中A1表示设备编号为1采集的数据集合,A2表示设备编号为2采集的数据集合,A
n
表示设备编号为n采集的数据集合。4.如权利要求3所述的一种以采集频率与范围为权重的数据关联度计算方法,其特征在于,对原始轨迹数据A进行排序和批次划分,并去重,具体包括:设目标设备的编号为i,根据编号i获取目标设备的基本信息,所述基本信息包括采集半径、采集频率和上报周期;提取编号为i的目标设备采集的数据集合A
i
,对数据集合A
i
内的原始轨迹数据按采集时间由小到大进行排序;再根据采集频率和上报周期,对排序之后的数据集合A
i
内的原始轨迹数据进行批次划分,并对同一批次内的原始轨迹数据进行去重,得到无重复数据的批次集合A
i
={A
i1
,A
i2
,...,A
in
};其中,A
i1
为数据集合A
i
内第1个数据的批次集合,A
i2
为数据集合A...
【专利技术属性】
技术研发人员:胡业勇,王亚飞,张鹏,
申请(专利权)人:南京小唐安朴科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。