【技术实现步骤摘要】
基于地址树模型的中文地址提取方法
本专利技术涉及计算机技术、数据检索、计算机数据处理领域,尤其涉及一种基于地址树模型的中文地址提取方法。
技术介绍
地址是一种对个体地域空间位置信息的编码方法,在我国,由于城市快速发展,地址规划相对落后,非标准地址大量存在。以门牌的管理为例,如说明书附图图1所示,“福州市勘测院”所在的地址为“福州市鼓楼区湖东路188号”,该地址模型为“市|区|道路|门牌号”,其中,“市|区”部分由民政部地名办公室管理,“道路”由区(县)地名办公室管理,而“门牌号”由公安部门管理。目前全国到各省市,尚无一个统一的协调机构,这种突出的矛盾已经无法满足城市规划和信息化发展的需求。表1福州市地址模型示例中文地址模型研究已经得到越来越多学者关注,在《福州市居民地地名标志设置规范》中,已经对福州市的地址模型进行了全面的规范。表1通过分析福州市部分地址,提取了几种常用的地址模型,可以得到以下四个结论:(1)行政区划在地址模型中作用重要,作为主要的空间区域约束元素;(2)由于缺乏唯一、 ...
【技术保护点】
1.一种基于地址树模型的中文地址提取方法,其特征在于,包括以下步骤:/n步骤S1:对地址字符串进行分词和识别,生成地址元素集合X以及地址元素语义集合S;/n步骤S2:建立根结点root,提取地址元素x
【技术特征摘要】
1.一种基于地址树模型的中文地址提取方法,其特征在于,包括以下步骤:
步骤S1:对地址字符串进行分词和识别,生成地址元素集合X以及地址元素语义集合S;
步骤S2:建立根结点root,提取地址元素x1,遍历地址元素x1的语义集S1,构建地址语义结点,并依次连结到根节点;
步骤S3:提取后续地址元素xi,遍历其语义结点Si;执行语义级别的比较和空间约束关系一致性判断,进行与叶子节点的连接或生成新的子树。
2.根据权利要求1所述基于地址树模型的中文地址提取方法,其特征在于:步骤S3具体包括:
步骤S31:对于结点Sim(m=1,2,3…),依次与当前地址树的叶子节点li比较语义级别,若结点Sim语义级别低于叶子节点li,则执行步骤S32:
步骤S32:比较结点Sim与叶子节点li的空间约束关系一致性,
若空间约束关系一致,则结点Si1连结到当前叶子节点li;
若空间约束关系不一致,则沿当前地址树上...
【专利技术属性】
技术研发人员:张平,亢孟军,汪艳霞,叶蕾,刘越,曾伟东,陈建,黄磊,刘仁,林熹,
申请(专利权)人:福州市勘测院,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。