本申请公开了一种数据比对碰撞方法和装置,该方法包括:获取指定的时空范围;对时空范围内的轨迹数据进行数据处理;数据处理包括:将轨迹数据标准化为时空数据以及对时空数据进行时空索引处理获取时空特征索引数据;对时空特征索引数据进行时空特征去噪处理获取去燥时空特征索引数据;时空特征去噪处理包括:从时空特征索引数据中标记出一个或多个时空参数项中的相应数据是否存在;根据去燥时空特征索引数据中的时空索引维度从预先设置的时空特征库中提取待比对碰撞数据;将轨迹数据与待比对碰撞数据进行轨迹相似度计算完成时空数据比对碰撞。通过该实施例方案,快速的完成了数据提取,减少了计算量,并提高了比对准确率。
A data comparison collision method and device
【技术实现步骤摘要】
一种数据比对碰撞方法和装置
本文涉及数据处理技术,尤指一种数据比对碰撞方法和装置。
技术介绍
轨迹比对碰撞问题是一个轨迹相关性比对和搜索的问题。为公安业务场景中的找到人或物等实体之间的相关性,通过这种相关性来找到实际研究、判断、分析时的线索,为公安破案、情报等工作提供技术支撑。当前技术一般使用规则计算的方式,通过给定数据碰撞规则,直接计算原轨迹数据,按照时间和空间的规则匹配性来完成客户的轨迹比对碰撞需求,计算量大并且比对速度较慢。而且上述的轨迹碰撞计算方法中,直接基于原始轨迹数据通过实际规则来完成轨迹碰撞,这些原始轨迹数据中有大量的数据因为感知设备采集数据的不稳定会出现异常错误,这些异常值在实际轨迹比对碰撞中会影响具体轨迹相似度计算值。
技术实现思路
本申请提供了一种数据比对碰撞方法和装置,能够快速的完成数据提取,减少计算量,实现实时轨迹的快速比对碰撞,并提高比对准确率。本申请提供了一种数据比对碰撞方法,所述方法可以包括:获取指定的时空范围;对所述时空范围内的轨迹数据进行数据处理;所述数据处理可以包括:将所述轨迹数据标准化为时空数据以及对所述时空数据进行时空索引处理获取时空特征索引数据;对所述时空特征索引数据进行时空特征去噪处理,获取去燥时空特征索引数据;所述时空特征去噪处理包括:从所述时空特征索引数据中标记出一个或多个时空参数项中的相应数据是否存在;所述时空参数项包括实体ID、等分时段和/或空间位置;根据所述去燥时空特征索引数据中的时空索引维度从预先设置的时空特征库中提取待比对碰撞数据;将所述轨迹数据与所述待比对碰撞数据进行轨迹相似度计算,完成时空数据比对碰撞。在本申请的示例性实施例中,所述将所述轨迹数据标准化为时空数据可以包括:将与所述轨迹数据相关的行为实体赋予唯一的实体身份标识ID;将所述轨迹数据中的每个空间位置定义为一个唯一的空间地点ID;将所述轨迹数据中的采集时间按照预设的时间间隔对全部轨迹数据进行等分。在本申请的示例性实施例中,所述将所述轨迹数据标准化为时空数据还可以包括:将所述时空数据进行表格化;所述将所述时空数据进行表格化可以包括:将实体ID作为表格的第一项目录;将所述空间地点ID作为第二项目录;将所述采集时间作为第三项目录;其中,每一个等分时段按照时间顺序依次列于第三项目录中。在本申请的示例性实施例中,所述时空索引维度可以包括以下任意一种或多种:实体维度、时间维度和空间维度;所述对所述时空数据进行时空索引处理可以包括:将所述时空数据按照预设的一个或多个时空索引维度进行存储。在本申请的示例性实施例中,将所述时空数据按照实体维度进行存储可以包括:将每个实体ID对应的全部空间位置存储到预设的第一地点分片中,将每个实体ID对应的全部等分时段的数据存储到预设的第一时间分片中,并将每个实体ID对应的第一地点分片和第一时间分片压缩到第一文件中;将所述时空数据按照空间维度进行存储包括:将每个空间位置对应的全部实体ID存储到预设的第一实体分片中,将每个空间位置对应的全部等分时段的数据存储到预设的第二时间分片中,并将每个空间位置对应的第一实体分片和第二时间分片压缩到第二文件中;将所述时空数据按照时间维度进行存储包括:将每个等分时段对应的全部实体ID存储到预设的第二实体分片中,将每个等分时段对应的全部空间位置存储到预设的第二地点分片中,并将每个等分时段对应的第二实体分片和第二地点分片压缩到第三文件中。在本申请的示例性实施例中,所述从所述时空特征索引数据中标记出一个或多个时空参数项中的相应数据是否存在包括:对按照任意的一个时空索引维度存储所获取的时空特征索引数据中的每个实体ID、等分时段和/或空间位置进行标记;以区分出所述时空特征索引数据中针对一个实体ID、一个等分时段和/或一个空间位置是否存在相应数据。在本申请的示例性实施例中,所述对按照任意的一个时空索引维度存储所获取的时空特征索引数据中的全部实体ID、等分时段和/或空间位置进行标记可以包括:将存在的实体ID、等分时段和/或空间位置标记为第一符号;将不存在的实体ID、等分时段和/或空间位置标记为第二符号。在本申请的示例性实施例中,所述方法还可以包括:预先对实时采集的每一个轨迹数据进行所述数据处理,并将数据处理后获得的时空索引数据存储到指定的数据库,构成所述时空特征库。在本申请的示例性实施例中,所述将所述轨迹数据与所述待比对碰撞数据进行轨迹相似度计算可以包括:获取所述轨迹数据的第一轨迹向量以及所述待比对碰撞数据的第二轨迹向量;根据余弦相似度算法计算所述第一轨迹向量和所述第二轨迹向量的相似度;将计算结果与预设的相似度阈值相比较,根据比较结果确定所述轨迹数据对应的第一时空轨迹与所述待比对碰撞数据对应的第二时空轨迹是否相似。本申请还提供了一种数据比对碰撞装置,包括处理器和计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令被所述处理器执行时,实现上述任意一项所述的数据比对碰撞方法。与相关技术相比,本申请包括:获取指定的时空范围;对所述时空范围内的轨迹数据进行数据处理;所述数据处理可以包括:将所述轨迹数据标准化为时空数据以及对所述时空数据进行时空索引处理获取时空特征索引数据;对所述时空特征索引数据进行时空特征去噪处理,获取去燥时空特征索引数据;所述时空特征去噪处理包括:从所述时空特征索引数据中标记出一个或多个时空参数项中的相应数据是否存在;所述时空参数项包括实体ID、等分时段和/或空间位置;根据所述去燥时空特征索引数据中的时空索引维度从预先设置的时空特征库中提取待比对碰撞数据;将所述轨迹数据与所述待比对碰撞数据进行轨迹相似度计算,完成时空数据比对碰撞。通过该实施例方案,快速的完成了数据提取,减少了计算量,实现了实时轨迹的快速比对碰撞,并提高了比对准确率。本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的其他优点可通过在说明书以及附图中所描述的方案来实现和获得。附图说明附图用来提供对本申请技术方案的理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。图1为本专利技术实施例的数据比对碰撞方法流程图;图2为本专利技术实施例的数据比对碰撞方法示意图;图3为本专利技术实施例的数据比对碰撞装置组成框图。具体实施方式本申请描述了多个实施例,但是该描述是示例性的,而不是限制性的,并且对于本领域的普通技术人员来说显而易见的是,在本申请所描述的实施例包含的范围内可以有更多的实施例和实现方案。尽管在附图中示出了许多可能的特征组合,并在具体实施方式中进行了讨论,但是所公开的特征的许多其它组合方式也是可能的。除非特意加以限制的情况以外,任何实施例的任何特征或本文档来自技高网...
【技术保护点】
1.一种数据比对碰撞方法,其特征在于,所述方法包括:/n获取指定的时空范围;/n对所述时空范围内的轨迹数据进行数据处理;所述数据处理包括:将所述轨迹数据标准化为时空数据以及对所述时空数据进行时空索引处理获取时空特征索引数据;/n对所述时空特征索引数据进行时空特征去噪处理,获取去燥时空特征索引数据;所述时空特征去噪处理包括:从所述时空特征索引数据中标记出一个或多个时空参数项中的相应数据是否存在;所述时空参数项包括实体ID、等分时段和/或空间位置;/n根据所述去燥时空特征索引数据中的时空索引维度从预先设置的时空特征库中提取待比对碰撞数据;/n将所述轨迹数据与所述待比对碰撞数据进行轨迹相似度计算,完成时空数据比对碰撞。/n
【技术特征摘要】
1.一种数据比对碰撞方法,其特征在于,所述方法包括:
获取指定的时空范围;
对所述时空范围内的轨迹数据进行数据处理;所述数据处理包括:将所述轨迹数据标准化为时空数据以及对所述时空数据进行时空索引处理获取时空特征索引数据;
对所述时空特征索引数据进行时空特征去噪处理,获取去燥时空特征索引数据;所述时空特征去噪处理包括:从所述时空特征索引数据中标记出一个或多个时空参数项中的相应数据是否存在;所述时空参数项包括实体ID、等分时段和/或空间位置;
根据所述去燥时空特征索引数据中的时空索引维度从预先设置的时空特征库中提取待比对碰撞数据;
将所述轨迹数据与所述待比对碰撞数据进行轨迹相似度计算,完成时空数据比对碰撞。
2.根据权利要求1所述的数据比对碰撞方法,其特征在于,所述将所述轨迹数据标准化为时空数据包括:
将与所述轨迹数据相关的行为实体赋予唯一的实体身份标识ID;
将所述轨迹数据中的每个空间位置定义为一个唯一的空间地点ID;
将所述轨迹数据中的采集时间按照预设的时间间隔对全部轨迹数据进行等分。
3.根据权利要求2所述的数据比对碰撞方法,其特征在于,所述将所述轨迹数据标准化为时空数据还包括:将所述时空数据进行表格化;
所述将所述时空数据进行表格化包括:
将实体ID作为表格的第一项目录;
将所述空间地点ID作为第二项目录;
将所述采集时间作为第三项目录;其中,每一个等分时段按照时间顺序依次列于第三项目录中。
4.根据权利要求2所述的数据比对碰撞方法,其特征在于,所述时空索引维度包括以下任意一种或多种:实体维度、时间维度和空间维度;
所述对所述时空数据进行时空索引处理包括:将所述时空数据按照预设的一个或多个时空索引维度进行存储。
5.根据权利要求4所述的数据比对碰撞方法,其特征在于,将所述时空数据按照实体维度进行存储包括:将每个实体ID对应的全部空间位置存储到预设的第一地点分片中,将每个实体ID对应的全部等分时段的数据存储到预设的第一时间分片中,并将每个实体ID对应的第一地点分片和第一时间分片压缩到第一文件中;
将所述时空数据按照空间维度进行存储包括:将每个空间位置对应的全部...
【专利技术属性】
技术研发人员:梁秀钦,于霄,
申请(专利权)人:北京明略软件系统有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。