【技术实现步骤摘要】
一种非标准地址转标准地址的方法
[0001]本专利技术涉及标准化地址生成
,尤其涉及一种非标准地址转标准地址的方法
。
技术介绍
[0002]标准化地址对于一个城市至关重要,目前城市中存在不少重复或者模糊的地址,地址的不规范和多样性不仅会给社会公众带来一定的困扰,而且还会给城市的决策者在制定政策时产生一定的阻碍,当前政府中拥有地理实体地址的部门有公安
、
民政等部门,但各个部门之间数据的命名方式不完全一致,同一地理实体可能有多个名称,不利于统一管理
。
[0003]目前将地理实体的名称进行规范化的方法主要是地名地址匹配技术,采用一定的规则将现有的名称进行分割然后获取关键词,利用获取的关键字对标准地址数据库进行检索进而确定地理实体的标准地址,当前地名地址匹配技术的缺陷如下:
1、
对非标准地名地址进行分割获取关键字的方法不够精确,有时无法获取关键字;
2、
对海量数据进行地名地址精确匹配的精度低;
3、
对海量数据进行地名地址精确匹配 ...
【技术保护点】
【技术特征摘要】
1.
一种非标准地址转标准地址的方法,其特征在于,包括以下步骤:
S1、
构建标准地址库,所述标准地址库包括全量地址库
、
行政区划库
、
语义词库和地名库;
S2、
获取非标准地址文本,非标准地址文本与语义词库比对提取冗余词;
S3、
去除冗余词的非标准地址文本与行政区划库比对提取区划词;
S4、
去除区划词的非标准地址文本与地名库比对提取地名词;
S5、
去除地名词的非标准地址文本与语义词库比对提取语义关联词,并对提取的语义关联词进行关联匹配;
S6、
去除语义关联词的非标准地址文本与语义词库比对提取辅助词;
S7、
对获取的区划词
、
地名词和辅助词进行权重排序;
S8、
根据权重排序结果与全量地址库进行比对获取标准化地址
。2.
根据权利要求1所述的一种非标准地址转标准地址的方法,其特征在于:所述语义词库包括辅助词库
、
冗余词库和关联词库
。3.
根据权利要求1所述的一种非标准地址转标准地址的方法,其特征在于:所述
S7
权重排序中,地名词的权重排序级别最高
。4.
根据权利要求1所述的一种非标准地址转标准地址的方法,其特征在于:所述
S5
中对提取的语义关联词进行关联匹配时,包括对区划词
、
地名词和辅助词进行关联
。5.
...
【专利技术属性】
技术研发人员:吴章山,杨岩,汪绪柱,胡立之,王腾飞,王黎升,
申请(专利权)人:中科星图智慧科技安徽有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。