基于地理信息系统权重分析模型的地址自动清洗方法技术方案

技术编号:37863487 阅读:24 留言:0更新日期:2023-06-15 20:53
本发明专利技术公开了一种基于地理信息系统权重分析模型的地址自动清洗方法,基于标准坐标系对地址信息中的大要素切分比对,与主体的名称、地址单向查询以及大要素联合查询的结果构建权重分析模型,权重值可动态完善,从而判断地址信息的准确性、进行纠偏获得准确的地址信息,提高对地址信息匹配的准确性。提高对地址信息匹配的准确性。提高对地址信息匹配的准确性。

【技术实现步骤摘要】
基于地理信息系统权重分析模型的地址自动清洗方法


[0001]本专利技术涉及地址自动清洗方法,特别是一种基于地理信息系统权重分析模型的地址自动清洗方法。

技术介绍

[0002]知识产权数据信息的应用场景需求越来越多,比如地址信息可用于监测目标区域内知识产权的维持情况、迁出迁入实时变动情况,但这有赖于地址信息的真实性、准确性。
[0003]而商标、专利在申请等环节,与申请人等主体相关的地址信息存在填写不规范、不稳定、不完整的情况,在数据信息入库时,地址信息无法与真实地址精准匹配。
[0004]目前常用于判断专利申请人区属划分的方式是对申请人地址进行关键词切词,将申请人地址进行省市区县匹配来实现区域匹配,比如“江苏省镇江市新区双子楼B座11楼”,通过切词形成“江苏”、“江苏省”、“镇江”、“镇江市”【大要素】和“新区双子楼B座11楼”【小要素】的词库,进行概率计算,形成有效的区域信息,这种区域匹配方式已常用于快递行业全国区域分拣和预筛选。但盲目使用基于概率分析的统计方法不能够解决多个地址信息确权的问题,同时在复杂干扰的地址信息下容易出本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于地理信息系统权重分析模型的地址自动清洗方法,其特征在于包括以下步骤:步骤100:对主体的入库名称通过标准坐标系查询经纬度坐标,得到坐标集A{A1,

,A
n
},n≥1,对主体的入库地址通过所述标准坐标系查询经纬度坐标,得到坐标集B{B1,

,B
m
},m≥1,判断所述坐标集A与所述坐标集B是否完全一致,如不一致则判断存在入库地址信息偏差;步骤200:选择所述坐标集A和/或所述坐标集B,步骤201:以选择的坐标集的其中一个经纬度坐标,通过使用所述标准坐标系的地图工具进行反向解析验证得到验证地址,对所述验证地址切词提取得到大要素,以所述大要素+所述入库名称得到匹配地址,对所述匹配地址通过所述标准坐标系查询经纬度坐标,得到坐标集C{C1,

,C
p
},p≥1,步骤202:以选择的坐标集的其它每个经纬度坐标,分别执行步骤201;共得到i组坐标集C,i=n或m或不大于n+m;步骤300:以坐标集A、坐标集B、i组坐标集C的所有经纬度坐标的范围,建立线性回归方程;步骤400:以坐标集A、坐...

【专利技术属性】
技术研发人员:彭彦戴峻李宇鹏孙爱超陈康陈月婷
申请(专利权)人:南京畅远信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1