The invention discloses a method of address matching based on dictionary and machine learning, including address parsing module, address standardization module, address matching module and address screening module. The address resolution module is used to address address information of the input address, and the resolved address data is input to the address standardization module. After standardized processing, the addressed address information is input into the address matching module to match, and the matched address information is processed by the address screening module to obtain the final standard address information; the invention relates to the information technology field; the present invention is compared with the other existing fuzzy matching based on the address dictionary segmentation. The method of fuzzy address dictionary matching is more flexible, and does not need to accumulate the address meta dictionary, avoiding too much manpower to maintain the address dictionary, but also effectively avoids the problem of the decrease of the matching rate caused by the change of address information and the untimely updating of the address dictionary.
【技术实现步骤摘要】
一种基于词典和机器学习的地址匹配方法
本专利技术涉及信息
,具体为一种基于词典和机器学习的地址匹配方法。
技术介绍
在公安行业中的海量文本挖掘过程中,经常需要找到案件信息中的地址所在地图的位置以及地址之间的距离,以提高案发地址的可视性和计算关联性。这就需要在已知地址的情况下,通过与标准地址库对比找到其标准地址和对应的经纬度,而后通过经纬度映射到地图上并且计算出两个地址之间的距离。但是在实际的项目应用中,标准地址库一般存有百万乃至千万级以上的标准地址信息,如果对输入的地址信息不加处理直接进行匹配操作,既会造成巨大的时间代价又会使得的匹配的准确率不高。所以在大数据背景下,一种快速有效的地址匹配方法将会推动人工智能在自然语言领域的行业应用。
技术实现思路
本专利技术所要解决的主要问题是提供一种基于词典和机器学习的地址匹配方法,从标准地址数据库中快速的匹配出准确或者最接近的地址信息,从而提取出该地址对应的经纬度。技术方案为实现以上目的,本专利技术通过以下技术方案予以实现:一种基于词典和机器学习的地址匹配方法,包括地址解析模块、地址标准化模块、地址匹配模块和地址筛选模块, ...
【技术保护点】
一种基于词典和机器学习的地址匹配方法,包括地址解析模块(1)、地址标准化模块(2)、地址匹配模块(3)和地址筛选模块(4),其特征在于,所述地址解析模块(1)用于将输入的地址信息进行地址解析,解析后的地址数据输入到地址标准化模块(2)经过标准化处理,处理后的地址信息输入到地址匹配模块(3)中进行匹配,匹配到的地址信息利用地址筛选模块(4)的处理得到最终的标准地址信息。
【技术特征摘要】
1.一种基于词典和机器学习的地址匹配方法,包括地址解析模块(1)、地址标准化模块(2)、地址匹配模块(3)和地址筛选模块(4),其特征在于,所述地址解析模块(1)用于将输入的地址信息进行地址解析,解析后的地址数据输入到地址标准化模块(2)经过标准化处理,处理后的地址信息输入到地址匹配模块(3)中进行匹配,匹配到的地址信息利用地址筛选模块(4)的处理得到最终的标准地址信息。2.根据权利要求1所述的一种基于词典和机器学习的地址匹配方法,其特征在于:在地址解析模块(1)中,利用地址词典对输入的地址信息按照区县、乡镇、村组、居委会、小区、楼幢依次进行解析。3.根据权利要求1所述的一种基于词典和机器学习的地址匹配方法,其特征在于:在...
【专利技术属性】
技术研发人员:金勇,李元,
申请(专利权)人:武汉烽火普天信息技术有限公司,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。