【技术实现步骤摘要】
查询方法、装置、电子设备以及存储介质
本申请涉及人工智能领域,尤其涉及大数据技术中的时空大数据
具体地,本申请提供了一种查询方法、装置、电子设备以及存储介质。
技术介绍
在互联网普及的大环境下,各类监控、卡口等采集设备每天都会产生大量用户的行为数据。其中,行为数据可以包括住店行为、交通出行行为、通话行为、快递行为、犯罪羁押行为等。基于这些行为数据,可以分析得到各类实体之间的动态关联关系,从而发现不同人、车、或者设备之间的隐型关系,这对于案件研判、维稳、涉恐、涉暴等安全场景具有重要的意义。相关技术中,各类实体之间的动态关联关系的查询主要采用映射归纳(mapreduce)的方式。具体的,可以通过从hive数据库使用对象关系映射框架查询语言(hibernatequerylanguage,HQL)或者编写分布式查询程序,来进行查询和排序计算。然而,采用mapreduce的方式查询动态关联关系通常会出现查询速度较慢的问题。
技术实现思路
本申请提供了一种查询方法、装置、电子设备以及存储介质。根据本申 ...
【技术保护点】
1.一种查询方法,包括:/n接收终端设备发送的查询请求,所述查询请求用于请求查询目标实体的动态关联关系,所述查询请求包括目标实体的标识和查询起止时间;/n根据所述查询起止时间,确定查询数据库中待查询的至少一个时间分桶,每个所述时间分桶存储有该时间分桶对应的时间段内的目标实体的动态关联关系;/n在所述至少一个时间分桶中根据所述目标实体的标识查询所述目标实体的动态关联关系。/n
【技术特征摘要】
1.一种查询方法,包括:
接收终端设备发送的查询请求,所述查询请求用于请求查询目标实体的动态关联关系,所述查询请求包括目标实体的标识和查询起止时间;
根据所述查询起止时间,确定查询数据库中待查询的至少一个时间分桶,每个所述时间分桶存储有该时间分桶对应的时间段内的目标实体的动态关联关系;
在所述至少一个时间分桶中根据所述目标实体的标识查询所述目标实体的动态关联关系。
2.根据权利要求1所述的方法,其中,所述查询数据库中包括至少两种类型的时间分桶,每种类型的时间分桶对应的时长不同,所述根据所述查询起止时间,确定查询数据库中待查询的至少一个时间分桶,包括:
将覆盖所述查询起止时间所用的数量最少的时间分桶确定为所述查询数据库中待查询的至少一个时间分桶。
3.根据权利要求1或2所述的方法,其中,所述在所述至少一个时间分桶中根据所述目标实体的标识查询所述目标实体的动态关联关系,包括:
生成所述查询请求对应的结构化查询语言SQL;
根据所述SQL,在所述至少一个时间分桶中查询所述目标实体的动态关联关系。
4.根据权利要求1所述的方法,在所述至少一个时间分桶中根据所述目标实体的标识查询所述目标实体的动态关联关系之后,还包括:
获取所述目标实体的动态关联关系的权重,所述目标实体的动态关联关系的权重与所述动态关联关系的关注级别相关联;
根据所述目标实体的动态关联关系的权重,对所述目标实体的动态关联关系进行排序;
从排序后的目标实体的动态关联关系中确定出可用的所述目标实体的动态关联关系。
5.根据权利要求4所述的方法,在所述从排序后的目标实体的动态关联关系中确定出可用的所述目标实体的动态关联关系之前,还包括:
若所述目标实体的动态关联关系的出现频率超过频率阈值,则确定所述目标实体的动态关联关系异常;
删除异常的目标实体的动态关联关系。
6.根据权利要求1所述的方法,在所述接收终端设备发送的查询请求之前,还包括:
获取采集设备采集的各实体的数据;
根据所述各实体的数据,在所述数据库中对所述各实体的动态关联关系进行更新。
7.根据权利要求6所述的方法,其中,所述根据所述各实体的数据,在所述数据库中对所述各实体的动态关联关系进行更新,包括:
将所述各实体的数据合并到至少一个时空虚拟点中,所述时空虚拟点为经度、维度和时间构成的三元组;
确定每个时空虚拟点中各实体之间的动态关联关系;
将所述每个时空虚拟点中各实体之间的动态关联关系更新至对应的时间分桶中。
8.根据权利要求7所述的方法,其中,所述动态关联关系包括同框关系。
9.根据权利要求8所述的方法,其中,确定每个时空虚拟点中各实体之间的动态关联关系,包括:
若每个时空虚拟点中的两个实体之间的距离小于第一距离阈值且所述两个实体之间的时间差小于第一时间阈值,则确定所述两个实体之间存在同框关系。
10.根据权利要求6所述的方法,在所述获取采集设备采集的各实体的数据之后,还包括:
对所述各实体的数据进行预处理,过滤所述各实体的数据中的至少一项无效数据,所述无效数据包括无效实体标识、无效地理位置和无效时间。
11.根据权利要求7所述的方法,在将所述各实体的数据合并到至少一个时空虚拟点中之后,还包括:
对每个时空虚拟点中所述各实体的数据进行归一化处理。
12.根据权利要求11所述的方法,其中,所述对每个时空虚拟点中所述各实体的数据进行归一化处理,包括:
若所述每个时空虚拟点中同一个实体的不同数据记录的距离小于第二距离阈值且时间差小于第二时间阈值,则将所述同一个实体的不同数据归一为一个数据。
13.一种查询装置,包括:
接收模块,用于接收终端设备发送的查询请求,所述查询请求用于请...
【专利技术属性】
技术研发人员:杨双全,张阳,谢奕,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。