描述文本和空间场景样本集的构建方法、装置及存储介质制造方法及图纸

技术编号:39001523 阅读:31 留言:0更新日期:2023-10-07 10:33
本公开是关于一种描述文本和空间场景样本集的构建方法、装置及存储介质。描述文本和空间场景样本集的构建方法包括:从媒体平台收集与旅游景点相关的游记描述文本的数据信息;根据所述游记描述文本的数据信息,利用自然语言处理相关技术提取所述游记描述文本中的空间约束关系;基于所述空间约束关系,对所述地理实体及所述地理实体之间的空间关系进行处理,构建RDF空间约束关系三元组;利用空间查询,将所述RDF空间约束关系三元组与实际的空间场景进行对照,找到与所述游记描述文本相对应的真实地图,得到空间场景的数据信息;将所述游记描述文本的数据信息与所述真实地图的空间场景的数据信息一一对应,得到成对的描述文本和空间场景的训练样本集。文本和空间场景的训练样本集。文本和空间场景的训练样本集。

【技术实现步骤摘要】
描述文本和空间场景样本集的构建方法、装置及存储介质


[0001]本公开涉及计算机
,尤其涉及一种描述文本和空间场景样本集的构建方法及装置、终端设备及存储介质。

技术介绍

[0002]空间场景是指通过一定的空间关系(拓扑、方向、距离关系)组合在一起的空间对象的集合。它反映了人类对世界的认知和理解,是人类活动与自然环境共同作用的结果。随着计算机和信息技术的发展,与空间场景相关的技术已经得到广泛的研究和实践,这些技术为空间检索、空间分析、地图综合和地图比较等应用提供支撑,是GIS空间分析领域和智能化地理信息检索的重要基础。
[0003]其中,生成问题是空间场景研究中的一个重要问题。然而,不管是面向自然语言的空间场景生成,还是面向空间场景的自然语言文本生成,都需要大量的“文本

场景”训练样本对。这样,基于深度学习的人工智能模型才能够将空间场景图及其描述文本结合起来进行学习,以实现更加准确的图像文本检索和场景理解。
[0004]在大数据和信息化时代,空间数据呈现爆炸性增长,出现了大量的空间场景图像以及空间场景描述本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种描述文本和空间场景样本集的构建方法,应用于电子设备中,其特征在于,所述方法包括:从媒体平台收集与旅游景点相关的游记描述文本的数据信息;根据所述游记描述文本的数据信息,利用自然语言处理相关技术提取所述游记描述文本中的空间约束关系;其中,所述空间约束关系包括:地理实体以及所述地理实体之间的空间关系,所述空间关系包括:拓扑关系、方向关系和距离关系;基于所述空间约束关系,对所述地理实体及所述地理实体之间的空间关系进行处理,构建RDF空间约束关系三元组;利用空间查询技术,将所述RDF空间约束关系三元组与实际的空间场景进行对照,在数据库中找到与所述游记描述文本相对应的真实地图,从而得到空间场景的数据信息;将所述游记描述文本的数据信息与所述真实地图的空间场景的数据信息一一对应,得到成对的描述文本和空间场景的训练样本集。2.根据权利要求1所述的方法,其特征在于,所述游记描述文本的数据信息,是指游客在旅行期间所产生的关于旅游地点、景点或者旅游活动的文字记录;其中,所述文字记录包括:游客对于旅游地点的感受、体验、评价、景点的特色、历史、文化背景的描述、以及空间场景信息。3.根据权利要求1所述的方法,其特征在于,所述游记描述文本数据包括:游客在社交媒体上发布的游记、个人博客、在线旅游平台上的点评、以及游记书籍。4.根据权利要求1所述的方法,其特征在于,所述自然语言处理相关技术,用于对所述游记描述文本中的地理信息进行分析和处理,包括:实体识别和空间关系抽取。5.根据权利要求4所述的方法,其特征在于,所述实体识别,能够识别出所述游记描述文本中涉及的所有地理实体,所述地理实体的类型包括建筑、河流或者道路;所述空间关系抽取,能够根据所述游记描述文本,抽取出所述地理实体相互之间的所述拓扑关系、所述方向关系和所述距离关系;其中,所述拓扑关系有分离、相交、和/或包含;所述方向关系有北、南、西、东、西北、西南、东北、和/或东南;所述距离关系有远、中、和/或近。6.根据权利要求1所述的方法,其特征在于,在不同的粒度空间或语境下,所述拓扑关系、所述方向关系和所述距离关系的定性描述具有不同的等级划分。7.根据权利要求1所述的方法,其特征在于,所述空间约束关系三元组是描述所述空间约束关系的基本数据模型,所述空间约束关系三元组包含:所述地理实体以及所述地理实体之间的空间关系。8.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述空间约束关系三元组与所述实际的空间场景进行对照时,根据地理实体确定所述游记描述文本描述的空间对象;根据对所述空间对象周围的描述,确定地图区域的具体位置以及囊括在内的其他空间对象,实现将所述游记描述文本与所述真实地图相关...

【专利技术属性】
技术研发人员:郭旦怀于珊珊于萦雪
申请(专利权)人:北京化工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1