【技术实现步骤摘要】
基于位置描述的显著性结构的位置概念结构化提取方法
本专利技术属于自然语言位置提取
,特别是涉及一种基于位置显著性描述的位置概念结构化提取方法。
技术介绍
多源异构地名数据大量增加,为了对不同来源不同结构的位置数据进行共享和集成,并根据位置名称检索精确获取准备的查询结果,需要从人们认知习惯角度出发,对大量标准及非标准地名描述进行分析,总结位置名称结构特征和空间关系,对地名结构语义信息进行概念和形式化表达,实现位置概念结构化建模。在此基础上要对位置名称和位置关系识别进而获得精确的位置概念描述,需要利用位置概念匹配的解析方式对位置概念模型化实例依照相应组合对象级规则进行处理,实现位置概念对象的高效抽取,获取准确的位置概念类型。由于实际的位置描述中可能出现表达错误、知识库不完备等原因,通过位置概念匹配方法得到的地名描述对象中,有许多程序是中间结果或者相对于其他结果此结果不够显著的代表此位置概念。一般的位置概念匹配只能对字符串信息进行匹配,难以灵活地融入地名实体和关系词汇之间的语义关系,更忽略了人们对地名的认知情况和对地名的描述习惯。此外,在规则数量较多且匹配细尺度的地名时,匹配效率很低,因此需要定义地名描述的显著性结构来对位置概念匹配生成的不显著匹配结果进行粗过滤。显著性结构是对地名结构语义信息知识表达的一种补充和优化,也是对地名结构的约束,有效提高了匹配结果的准确性,使其更符合人们认知和描述习惯。
技术实现思路
为了解决上述技术问题,本专利技术提出了一种基于位置描述显著性结构的位置概念结构化提取方法,对程序解析匹配的不显著性结果进行过滤,得到更能显著性代表位置 ...
【技术保护点】
一种基于位置描述的显著性结构的位置概念结构化提取方法,其特征在于,包括以下步骤:步骤1:基于位置描述结构本体建模,总结位置概念显著性结构及其顺序,自定义显著性语法语言,在程序初始化时读取并生成相应的类;实现显著性结构打分方法构建,为同一位置概念的不同显著性结构表达寻求一个最佳匹配结果,获得位置描述模型;步骤2:映射位置结构概念本体生成规则类,每一条规则类对应一个位置实体概念本体,最终生成规则集合;位置概念本体代表与位置有关对象的基本组成和层次关系,分为位置基础概念本体和位置实体概念本体,其中位置实体概念本体对应实际的空间实体或空间关系;位置结构概念本体是对位置实体概念本体具体组成方式的句法模式表达,其代表了这个位置实体概念本体的组成规则;步骤3:对规则集合进行分类,重新划分为若干个规则组,形成规则检索依赖图;步骤4:以任意自然语言文本位置描述语句和原始的自然语言文本位置描述语句作为输入,利用基于位置描述显著性结构的规则匹配算法进行匹配,通过打分排序完成位置信息的结构化提取。
【技术特征摘要】
1.一种基于位置描述的显著性结构的位置概念结构化提取方法,其特征在于,包括以下步骤:步骤1:基于位置描述结构本体建模,总结位置概念显著性结构及其顺序,自定义显著性语法语言,在程序初始化时读取并生成相应的类;实现显著性结构打分方法构建,为同一位置概念的不同显著性结构表达寻求一个最佳匹配结果,获得位置描述模型;步骤2:映射位置结构概念本体生成规则类,每一条规则类对应一个位置实体概念本体,最终生成规则集合;位置概念本体代表与位置有关对象的基本组成和层次关系,分为位置基础概念本体和位置实体概念本体,其中位置实体概念本体对应实际的空间实体或空间关系;位置结构概念本体是对位置实体概念本体具体组成方式的句法模式表达,其代表了这个位置实体概念本体的组成规则;步骤3:对规则集合进行分类,重新划分为若干个规则组,形成规则检索依赖图;步骤4:以任意自然语言文本位置描述语句和原始的自然语言文本位置描述语句作为输入,利用基于位置描述显著性结构的规则匹配算法进行匹配,通过打分排序完成位置信息的结构化提取。2.根据权利要求1所述的基于位置描述的显著性结构的位置概念结构化提取方法,其特征在于,步骤3中所述对规则集合进行分类,是利用规则分组依赖图,首先对所有节点之间依赖关系建立节点,然后采用贪婪的形式建立规则组,通过规则组的依赖关系合并存在交叉依赖的规则组;其中,每个节点对应一个规则集合,节点之间依赖关系是指上层的规则组中的与下层规则组中的存在交集,且上层的规则组中的与下层规则组中的不存在交集。3.根据权利要求1所述的基于位置描述的显著性结构的位置概念结构化提取方法,其特征在于,步骤4中所述基于位置描述显著性结构的规则匹配算法进行匹配,其具体实现包括以下子步骤:步骤4.1:输入位置基础概念本体的S实例、原子概念集W,将作为位置基础概念本体的S和原子概念集合W进行匹配,得出结果集合G;其中,原子概念集是位置基础概念本体对应语义位置的原子组成词汇的集合;将位置基础概念本体的S实例和W进行匹配,根据规则匹配生成匹配树集,将匹配树与相应概念的显著性结构进行选择、过滤和查询,获取具备显著特征的候选假...
【专利技术属性】
技术研发人员:朱欣焰,呙维,佘冰,胡涛,顾芷宁,
申请(专利权)人:武汉大学,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。