System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及地理知识查询检索,具体地说是一种基于知识图谱的地理空间信息查询方法、系统、设备及介质。
技术介绍
1、知识图谱是一种以结构化的形式描述客观世界中概念、实体及其关系的方式,将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。知识图谱给互联网语义搜索带来了活力,同时也在智能问答中显示出强大威力,已经成为互联网知识驱动的智能应用的基础设施。
2、针对时空数据和文本关键词的查询,目前已经取得了较好的进展,如ir-tree,brtree等;它们的主要思想都是在空间索引中维护其他额外的关键信息(如文本关键词信息等),以此在基于空间索引的空间剪枝的能力的基础上,增加额外的剪枝能力(如文本剪枝能力),最终有效地提高查询的效率;但是,正是由于在空间索引中维护了额外的信息,所以为了维护这些额外的信息而导致的空间上的开销,也是需要考虑和权衡的。除此之外,由于在知识图谱中数据是以节点(图数据)的形式存在,其时空信息和文件关键词信息是以节点的属性或独立的节点的形式存在,所以对于如何厘清不同粒度的空间实体和文本等非空间实体的逻辑关联关系、如何有效地利用地理关联技术去关联知识图谱中实体的语义信息和空间信息、如何有效地将时空数据和文本关键词的查询相关的高效算法应用于知识图谱中等等难点,仍具有一定的思考和研究的空间。
3、现有的地理信息系统在地理知识查询方面只提供了单一的搜索文本框,用户在使用时由于对搜索目标点模糊而不能快速确定最终的查询内容。当前的地理信息查询方式通常需要用户
技术实现思路
1、本专利技术的技术任务是提供一种基于知识图谱的地理空间信息查询方法、系统、设备及介质,来解决传统地理信息查询方式难以使用,查询方式粗犷,查询结果单一,不能形象展示查询结果与查询条件之间的信息关联关系的问题。
2、本专利技术的技术任务是按以下方式实现的,一种基于知识图谱的地理空间信息查询方法,该方法具体如下:
3、构建地理知识图谱:基于地图、影像、地形、属性以及元数据的基础地理信息数据以及网络百科全书数据构建地理知识图谱;
4、提示用户输入查询信息:接收用户问句,并提取用户问句包含的意图和实体;
5、构建查询算子:对用户输入的自然语言进行分词,提取查询标签及查询关系构建查询算子;
6、查找地理空间信息:根据查询算子从知识图谱数据中查找到相关地理空间信息,并返回查询结果;
7、展示查询结果:展示查询结果中地理对象、关联关系、属性及空间位置的信息。
8、作为优选,构建地理知识图谱具体如下:
9、设计地理知识图谱的存储结构、地理实体的存储结构和地理语料库的存储结构;
10、通过网络百科全书和地理数据库构建地理知识图谱的数据来源,提取网络百科全书和/或地理数据库的信息存储至地理实体结构;
11、从已融合的知识中提取空间关系;其中,空间关系包括拓扑关系及方向关系;如桥和河流之间的“横跨”关系,道路和公园之间的“穿过”关系等;
12、采用知识图谱存储工具将融合后的地理知识以图结构的方式存储。
13、更优地,设计地理知识图谱的存储结构、地理实体的存储结构和地理语料库的存储结构具体如下:
14、地理知识图谱的存储结构采用图结构存储,地理知识图谱的存储结构表示为:kg=(e,r,l);其中,e是一组实体;r是一组带标签的有向边;l是一组文字;一个完整的知识图谱kg是一个三元组,表示为其中e中的实体代表真实世界的实体,有向边r代表真实世界的实体关系和实体属性;
15、地理实体的存储结构表示为:e1=∑e;其中,e1表示地理实体之和;e表示一个地理实体;一个地理实体e被关系r修饰后才会具有更多的地理意义;其中,e∈e;r∈r;
16、地理语料库的存储结构表示为:地理语料库为c,地理实体n∈c,n被表示为一个三元组n=<i,l,t>;其中,i表示地理实体在语料库中的编号,是与其余地理实体的区分的关键依据;由于每个实体都具有经纬度,所以使用l属性记录地理实体的空间位置信息;t表示多个成对键值对的集合,t用于描述地理实体在现实空间中的意义。
17、更优地,通过网络百科全书和地理数据库构建地理知识图谱的数据来源,提取网络百科全书和/或地理数据库的信息存储至地理实体结构具体如下:
18、若网络百科全书和地理数据库的实体结构同时描述,但信息记录内容不完全一致,则认为地理数据库中的信息比较准确,采用地理数据库中的信息为准,对齐形成地理实体节点;
19、提取网络百科全书中的信息是通过实体名称打开百科全书条目后,提取信息框中的属性名称和值;对于提取的实体中存在的属性值,根据属性名称构建对象特性;
20、提取地理数据库的信息实体时,空间数据库包括一个表列表,每个表都包含若干行,即地理图形特征,实体名称和特性字段之间的对应关系用于形成对,用于描述关系;运用自然语言处理和文本挖掘技术,从文本及图像的非结构化数据中识别出与地理空间信息相关的实体,用三元组的形式表示,包括地理实体、属性和关系;
21、实体层的融合是不同数据中不同标识实体的语义理解,关联到同一实体上,实现对同名、多名和缩写的多种实体语义的消歧,例如:“c国”、“c国全称”等都是指同一个地理实体;具体为:先生成候选地理实体,通过地理实体指称项从地理知识库中选取候选地理实体;再对候选实体排序,通过标注训练数据集训练候选实体排序模型;模型预测地理节点n和候选地理实体e是否代表同一真实世界实体,并为预测提供置信度评分;最后,在节点n的分类候选对中选择具有最高置信度的地理实体建立正确身份链接。
22、作为优选,构建查询算子具体如下:
23、提取查询标签:查询标签用于描述查询主题或领域的关键词或短语;提取查询标签具体为:先对用户的查询请求进行文本处理,文本处理包括分词、去除停用词及词干提取;再使用关键词提取算法的文本挖掘技术从处理后的文本中提取出查询标签;
24、提取查询关系:查询关系用于表示地理空间信息之间的联系或关系;提取查询关系具体为:对地理知识图谱中的实体和概念进行分析,以确定实体和概念之间的语义关系;
25、使用依存句法分析及命名实体识别的自然语言处理技术从用户的查询请求中识别出与语义关系相关的关键词或短语;
26、利本文档来自技高网...
【技术保护点】
1.一种基于知识图谱的地理空间信息查询方法,其特征在于,该方法具体如下:
2.根据权利要求1所述的基于知识图谱的地理空间信息查询方法,其特征在于,构建地理知识图谱具体如下:
3.根据权利要求2所述的基于知识图谱的地理空间信息查询方法,其特征在于,设计地理知识图谱的存储结构、地理实体的存储结构和地理语料库的存储结构具体如下:
4.根据权利要求2所述的基于知识图谱的地理空间信息查询方法,其特征在于,通过网络百科全书和地理数据库构建地理知识图谱的数据来源,提取网络百科全书和/或地理数据库的信息存储至地理实体结构具体如下:
5.根据权利要求1所述的基于知识图谱的地理空间信息查询方法,其特征在于,构建查询算子具体如下:
6.根据权利要求1所述的基于知识图谱的地理空间信息查询方法,其特征在于,地理空间信息的查询条件构建时,结合地理知识图谱和自然语言处理技术,将用户的自然语言查询请求转换为图谱查询语言,从而实现对地理知识图谱的查询和检索;并利用地理知识图谱的结构特点,对图谱中的实体、概念以及关系进行分析和处理,从而得到符合条件的地理空
7.根据权利要求1所述的基于知识图谱的地理空间信息查询方法,其特征在于,展示查询结果具体如下:
8.一种基于知识图谱的地理空间信息查询系统,其特征在于,该系统用于实现权利要求1-7中任一项所述的基于知识图谱的地理空间信息查询方法;该系统包括:
9.一种电子设备,其特征在于,包括:存储器和至少一个处理器;
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序可被处理器执行以实现如权利要求1至7中任一项所述的基于知识图谱的地理空间信息查询方法。
...【技术特征摘要】
1.一种基于知识图谱的地理空间信息查询方法,其特征在于,该方法具体如下:
2.根据权利要求1所述的基于知识图谱的地理空间信息查询方法,其特征在于,构建地理知识图谱具体如下:
3.根据权利要求2所述的基于知识图谱的地理空间信息查询方法,其特征在于,设计地理知识图谱的存储结构、地理实体的存储结构和地理语料库的存储结构具体如下:
4.根据权利要求2所述的基于知识图谱的地理空间信息查询方法,其特征在于,通过网络百科全书和地理数据库构建地理知识图谱的数据来源,提取网络百科全书和/或地理数据库的信息存储至地理实体结构具体如下:
5.根据权利要求1所述的基于知识图谱的地理空间信息查询方法,其特征在于,构建查询算子具体如下:
6.根据权利要求1所述的基于知识图谱的地理空间信息查询方法,其特征在于,地理空间信息的查询条件...
【专利技术属性】
技术研发人员:王飞,吕艳婧,张华,苏凯亮,汤先伟,
申请(专利权)人:浪潮软件科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。