一种用于金融行业的地址分词方法技术

技术编号:26172207 阅读:29 留言:0更新日期:2020-10-31 13:48
本发明专利技术是关于用于金融行业的地址分词方法。该方法包括:接收输入的当前地址;调用预先建立的行政区划数据库;根据所述行政区划数据库,提取所述当前地址中的行政区划信息;根据所述行政区划信息进行地址分词,以获得地址分词结果;输出所述地址分词结果。通过本发明专利技术的技术方案,可避免采用现有通用中文分词解析出地址要素而导致准确率比较低,以充分提高地址分词的准确性,实现对金融行业用户所填写的地址信息的地址要素的准确提取。

【技术实现步骤摘要】
一种用于金融行业的地址分词方法
本专利技术涉及分词
,尤其涉及一种用于金融行业的地址分词方法。
技术介绍
目前,金融行业的客户地址信息主要来源于客户的填写,只有地址字符串可以利用,同时由于客户个人习惯、地域特征等不同,客户填写的地址不够规范。所以需要对地址进行分词,把客户填写地址字符串划分成有效的标准地址要素。而现有地址提取方法为基于现有通用中文分词技术对地址字符串进行分词,然后再根据分词结果进行地址要素的提取。但由于通用中文分词解析出来的地址要素准确率比较低,因而,影响了地址分词的准确性。
技术实现思路
本专利技术实施例提供了用于金融行业的地址分词方法。所述技术方案如下:根据本专利技术实施例提供了一种用于金融行业的地址分词方法,包括:接收输入的当前地址;调用预先建立的行政区划数据库;根据所述行政区划数据库,提取所述当前地址中的行政区划信息;根据所述行政区划信息进行地址分词,以获得地址分词结果;输出所述地址分词结果。在一个实施例中,所述方法还包括:当所述行本文档来自技高网...

【技术保护点】
1.一种用于金融行业的地址分词方法,其特征在于,包括:/n接收输入的当前地址;/n调用预先建立的行政区划数据库;/n根据所述行政区划数据库,提取所述当前地址中的行政区划信息;/n根据所述行政区划信息进行地址分词,以获得地址分词结果;/n输出所述地址分词结果。/n

【技术特征摘要】
1.一种用于金融行业的地址分词方法,其特征在于,包括:
接收输入的当前地址;
调用预先建立的行政区划数据库;
根据所述行政区划数据库,提取所述当前地址中的行政区划信息;
根据所述行政区划信息进行地址分词,以获得地址分词结果;
输出所述地址分词结果。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述行政区划信息提取失败时,将所述当前地址进行显示,以提示用户对所述当前地址进行行政区划信息的识别;
当所述行政区划信息识别成功时,利用成功识别的所述行政区划信息,对所述行政区划数据库进行自动更新;
当所述行政区划信息识别失败时,确认所述当前地址中的行政区划信息错误;
对所述行政区划信息进行自动纠错,并利用纠错后的所述行政区划信息对所述行政区划数据库进行自动更新。


3.根据权利要求1所述的方法,其特征在于,
所述根据所述行政区划信息进行地址分词,以获得地址分词结果,包括:
提取所述行政区划信息下的地址分割词和与所述地址分割词对应的分割参数;
根据所述地址分割词和所述分割参数,进行地址分词,以获得所述地址分词结果。


4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
调用预先建立的标准地址库;
将所述地址分词结果与所述标准地址库进行匹配;
若所述地址分词结果与所述标准地址库相匹配,则确认所述地址分词结果正确;
若所述地址分词结果与所述标准地址库不匹配,则确认所述地址分词结果错误。


5.根据权利要求4所述的方法,其特征在于,
所述若所述地址分词结果与所述标准地址库不匹配,则确认所述地址分词结果错误,包括:
若所述地址分词结果与所述标准地址库不匹配,将所述地址分词结果进行显示,以提示所述地址分词结果是否正确;
当所述地址分词结果正确时,利用所述地址分词结果对所述标准地址库进行更新,以获得更新后的所述标准地址库。


6.根据权利要求1所述的方法,其特征在于,所述方法还包括...

【专利技术属性】
技术研发人员:苏明富雷军曾忠晨陈浩
申请(专利权)人:睿智合创北京科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1