【技术实现步骤摘要】
结合RPA和AI的地址识别方法和装置
本申请涉及人工智能
,特别涉及一种结合RPA和AI的地址识别方法和装置。
技术介绍
机器人流程自动化(RoboticProcessAutomation)简称RPA,是通过特定的“机器人软件”,模拟人在计算机上的操作,按规则自动执行流程任务。人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。目前很多场景下出现了需要识别文本中地址的需求。相关技术中,地址识别方法为,利用地址结构知识库获取文本中地址的各个成分,然后利用检索系统对地址结构知识库中所有疑似的地址结构进行检索、排序后,交由用户选择。上述方法中,在文本中地址为包含错误的地址时,地址结构的召回率低,地址识别效率差。专 ...
【技术保护点】
1.一种结合RPA和AI的地址识别方法,其特征在于,包括:/nRPA系统获取待进行地址识别的文本;/n所述RPA系统结合所述文本以及地址抽取器,抽取所述文本中的地址以及所述地址中的各个成分;/n所述RPA系统根据所述地址中各个成分的行政区划代码,确定所述地址的行政区划代码;/n所述RPA系统结合所述地址、所述地址的行政区划代码以及地址结构知识库,获取所述地址对应的地址结构;/n所述RPA系统根据所述地址对应的地址结构,对所述地址进行补全和校正,得到地址识别结果。/n
【技术特征摘要】
1.一种结合RPA和AI的地址识别方法,其特征在于,包括:
RPA系统获取待进行地址识别的文本;
所述RPA系统结合所述文本以及地址抽取器,抽取所述文本中的地址以及所述地址中的各个成分;
所述RPA系统根据所述地址中各个成分的行政区划代码,确定所述地址的行政区划代码;
所述RPA系统结合所述地址、所述地址的行政区划代码以及地址结构知识库,获取所述地址对应的地址结构;
所述RPA系统根据所述地址对应的地址结构,对所述地址进行补全和校正,得到地址识别结果。
2.如权利要求1所述的地址识别方法,其特征在于,所述RPA系统根据所述地址中各个成分的行政区划代码,确定所述地址的行政区划代码,包括:
所述RPA系统获取所述地址中各个成分的行政区划代码;
所述RPA系统根据所述地址中各个成分的行政区划代码,生成行政区划代码集合;
所述RPA系统针对所述行政区划代码集合中的每个待处理的行政区划代码,判断所述行政区划代码集合中是否存在包括所述待处理的行政区划代码中非零数字串的第一行政区划代码;
在所述行政区划代码集合中存在所述第一行政区划代码时,所述RPA系统删除所述行政区划代码集合中所述待处理的行政区划代码;
所述RPA系统根据所述行政区划代码集合中各个行政区划代码的出现次数,确定所述地址的行政区划代码。
3.如权利要求2所述的地址识别方法,其特征在于,所述RPA系统根据所述行政区划代码集合中各个行政区划代码的出现次数,确定所述地址的行政区划代码,包括:
所述RPA系统根据所述行政区划代码集合中各个行政区划代码的出现次数,获取对应的出现次数最大的第二行政区划代码;
所述RPA系统将所述第二行政区划代码,确定为所述地址的行政区划代码。
4.如权利要求1所述的地址识别方法,其特征在于,所述RPA系统结合所述地址、所述地址的行政区划代码以及地址结构知识库,获取所述地址对应的地址结构,包括:
所述RPA系统结合所述地址的行政区划代码以及地址结构知识库,获取第一候选地址结构集合,所述第一候选地址结构集合中的第一候选地址结构,为对应的行政区划代码中包括所述地址的行政区划代码中非零数字串的行政区划代码;
所述RPA系统采用倒排索引方式对所述第一候选地址结构集合进行检索,获取第二候选地址结构集合,所述第二候选地址结构集合中的第二候选地址结构,为包括所述地址的至少第一预设数量个成分的第一候选地址结构;
所述RPA系统根据所述地址以及所述第二候选地址结构集合,确定所述地址对应的地址结构。
5.如权利要求4所述的地址识别方法,其特征在于,所述RPA系统根据所述地址以及所述第二候选地址结构集合,确定所述地址对应的地址结构,包括:
所述RPA系统获取所述地址中各个成分的权重;
所述RPA系统针对所述第二候选地址结构集合中的每个第二候选地址结构,确定所述第二候选地址结构中各个成分与所述地址中各个成分之间的编辑距离;
所述RPA系统根据所述第二候选地址结构中各个成分与所述地址中各个成分之间的编辑距离,以及所述地址中各个成分的权重,确定所述第二候选地址结构与所述地址之间的编辑距离;
所述RPA系统根据所述地址与各个第二候选地址结构之间的编辑距离,确定所述地址对应的地址结构。
6.如权利要求5所述的地址识别方法,其特征在于,所述RPA系统根据所述第二候选地址结构中各个成分与所述地址中各个成分之间的编辑距离,以及所述地址中各个成分的权重,确定所述第二候选地址结构与所述地址之间的编辑距离,包括:
...
【专利技术属性】
技术研发人员:胡一川,汪冠春,褚瑞,李玮,白龙飞,唐梓毅,
申请(专利权)人:北京来也网络科技有限公司,北京奔影网络科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。