一种信息查询方法、装置及存储介质制造方法及图纸

技术编号:37446831 阅读:19 留言:0更新日期:2023-05-06 09:18
本申请公开一种信息查询方法、装置及存储介质,涉及数据处理技术领域,用于在知识图谱中查询字段或者数据表的数据处理方法。该方法包括:获取查询条件信息,查询条件信息表征第一目标实体;基于查询条件信息,对数据仓库对应的知识图谱执行查询操作,获得查询结果;查询操作用于查询与第一目标实体具有关系的第二目标实体以及目标关系属性信息,目标关系属性信息表征第一目标实体与第二目标实体之间的关系;知识图谱用于指示多组第一实体与第二实体之间的关系,第一实体为数据表、字段或者数据处理方法,第二实体为数据表或者字段,数据表和字段归属于数据仓库,数据处理方法为用于对数据表或者字段进行处理的方法。于对数据表或者字段进行处理的方法。于对数据表或者字段进行处理的方法。

【技术实现步骤摘要】
一种信息查询方法、装置及存储介质


[0001]本申请涉及大数据算法特征数据处理
,尤其涉及一种信息查询方法、装置及存储介质。

技术介绍

[0002]目前,越来越多的企业开始构建数据仓库,数据仓库是一种用于存储数据的数据装置且具有数据分析的功能,企业常常将其作为互联网后台的数据仓库装置,用于存储海量的数据,以便对数据进行分析。
[0003]数据仓库的特征工程是指将数据仓库中的数据加工成为机器学习可用的特征。作为数据分析中常用的技术手段,高效地进行数据仓库的特征工程成为越来越迫切的需求。然而,一些较好的历史特征工程无法很好的被继承或者被保存,对数据处理领域来说是一大浪费,并且,使得后续进行的特征工程,往往依赖于算法工程师或者数据分析师的个人经验积累,比如,依赖于个人经验选择特征工程中要使用的数据处理方法。这意味着,当一些初级算法工程师或者数据分析师在特征工程方面的经验不足时,就需要进行大量尝试,浪费大量时间和精力。

技术实现思路

[0004]本申请提供一种信息查询方法、装置及存储介质,用于根据查询条件信息,获得知识图谱本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种信息查询方法,其特征在于,所述方法包括:获取查询条件信息,所述查询条件信息表征第一目标实体;基于所述查询条件信息,对数据仓库对应的知识图谱执行查询操作,获得查询结果;所述查询操作用于查询与所述第一目标实体具有关系的第二目标实体以及目标关系属性信息,所述目标关系属性信息表征所述第一目标实体与所述第二目标实体之间的关系;所述知识图谱用于指示多组第一实体与第二实体之间的关系,所述第一实体为数据表、字段或者数据处理方法,所述第二实体为数据表或者字段,所述数据表和所述字段归属于所述数据仓库,所述数据处理方法为用于对所述数据表或者所述字段进行处理的方法。2.根据权利要求1所述的信息查询方法,其特征在于,在所述第一实体和所述第二实体为两个不同数据表,或者为两个不同字段的情况下,所述第一实体与第二实体之间的关系为,基于预设关联方式建立的关联关系;在所述第一实体为数据表且所述第二实体为字段的情况下,所述第一实体与第二实体之间的关系为,所述第一实体包含所述第二实体;在所述第一实体为数据处理方法且所述第二实体为字段或者数据表的情况下,所述第一实体与第二实体之间的关系为,所述第一实体用于对所述第二实体进行处理。3.根据权利要求2所述的信息查询方法,其特征在于,在所述第一实体用于对所述第二实体进行处理的情况下,所述第一实体应用于所述第二实体的历史次数超过第一预设次数;在所述第一实体与所述第二实体具有所述关联关系的情况下,所述第一实体与所述第二实体之间基于所述预设关联方式产生关联的关联次数超过第二预设次数,所述历史次数和所述关联次数根据对所述第二实体的历史处理记录确定。4.根据权利要求1

3任一项所述的信息查询方法,其特征在于,所述知识图谱还用于指示所述第一实体和所述第二实体的实体描述信息,以及,所述第一实体与所述第二实体之间关系的关系属性信息;其中,在所述第一实体和所述第二实体为两个不同数据表,或者为两个不同字段的情况下,所述关系属性信息包括所述第一实体与所述第二实体之间的所述预设关联方式和所述关联次数;在所述第一实体为数据处理方法且所述第二实体为字段或者数据表的情况下,所述关系属性信息包括所述第一实体应用于所述第二实体的历史次数和得到的历史处理结果。5.根据权利要求1

3任一项所述的信息查询方法,其特征在于,所述查询结果包括所述第二目标实体的实体描述信息,以及所述第一目标实体与所述第二目标实体之间关系的关系属性信息。6.根据权利要求1

3任一项所述的信息查询方法,其特征在于,所述方法还包括:在所述第一目标实体为待处理的数据表或者待处理的字段的情况下,从所述第二目标实体指示的数据处理方法中选择目标数据处理方法;利用所述目标数据处理方法对所述待处理的数据表或者待处理的字段进行处理。7.一种知识图谱构建方法,其特征在于,包括:获取数据仓库的历史处理记录;所述数据仓库包括数据表,所述数据表包括字段;所述历史处理记录为使用数据处理方法对所述数据表和/或所述数据表中字段进行处理的记录
信息;基于所述数据仓库的每一条历史处理记录,解析出所述数据表、所述数据表中的字段和所述数据处理方法中的一项或者多项;以解析出的所述数据表、所述字段或者所述数据处理方法为第一实体,以解析出的所述数据表或者字段为第二实体,确定多组第一实体与第二实体之间的关系;构建用于指示所述多组第一实体与第二实体之间的关系的知识图谱,所述知识图谱中的相连的两个节点表示一组所述第一实体和第二实体,连接所述两个节点的边表示该组所述第一实体和第二实体的关系。8.根据权利要求7所述的知识图谱构建方法,其特征在于,所述以所述数据表、所述字段或者所述数据处理方法为第一实体,以所述数据表或者字段为第二实体,确定多组第一实体与第二实体之间的关系,包括:以所述数据表、所述字段和所述数据处理方法为实体,确定不同实体之间的关系和关系属性信息;其中,两个不同数据表之间或者两个不同字段之间的关系包括关联关系,所述关联关系对应的关系属性信息包括预设关联方式和关联次数;所述数据处理方法与被处理数据之间的关系包括所述数据处理方法用于对所述被处理数据进行处理,所述被处理数据为字段或者数据表,所述数据处理方法与被处理数据之间的关系对应的关系属性信息包括所述数据处理方法应用于所述被处理数据的历史次数;根据所述不同实体之间的关系和关系属性信息,从所述实体中筛选出满足预设构建条件的多组所述第一实体和第二实体,所述预设构建条件包括一种所述数据处理方法应用于同一个被处理数据的历史次数超过第一预设次数,两个不同数据表或者两个不同字段之间通过同种预设关联方式发生关联的次数超过第二预设次数;基于多组所述第一实体和第二实体及每组所述第一实体和第二实体之间的关系,构建所述数据仓库对应的知识图谱。9.根据权利要求7或8所述的知识图谱构建方法,其特征在于,所述历史处理记录包括:基于所述数据仓库中的数据表构建宽表的过程中,所产生的处理记录;基于构建的宽表,处理所述宽表中字段的过程中所产生的处理记录。10.一种信息查询装置,其特征在于,包括:获取模块,用于获取查询条件信息,所述查询条件信息表征第一目标实体;查询模块,用于基于所述查询条件信息,对数据仓库对应的知识图...

【专利技术属性】
技术研发人员:郭峰
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1