地址识别方法、系统、存储介质及电子设备技术方案

技术编号:30824632 阅读:24 留言:0更新日期:2021-11-18 12:17
本申请公开了一种地址识别方法、系统、存储介质及电子设备,方法包括:数据准备步骤:使用NER对采集的样本地址信息进行识别后生成三元组数据;构建步骤:使用关系型数据库根据所述三元组数据构建知识图谱;关系查找步骤:通过所述知识图谱查找数据的关系识别出所述数据中的地址信息。本发明专利技术可以使用知识图谱推理的方法对地址之间的关系进行判断,从而可以清晰快速的判断不同地址之间的关系,节省了成本。本。本。

【技术实现步骤摘要】
地址识别方法、系统、存储介质及电子设备


[0001]本专利技术属于地址识别领域,具体涉及一种地址识别方法、系统、存储介质及电子设备。

技术介绍

[0002]在进行名片识别时,需要对文字识别的内容进行分类和信息提取,其中地址是一种非常重要的信息。在识别名片中的地址时,经常出现上下多行的地址信息,这些信息可能需要被拼接在一起也可能为两个地址。根据关键词很难对多行地址的关系进行判断,本专利技术介绍了一种基于知识图谱推理的地址识别方法来解决这一问题。

技术实现思路

[0003]本专利技术实施例提供了一种地址识别方法,其中,包括:
[0004]数据准备步骤:使用NER对采集的样本地址信息进行识别后生成三元组数据;
[0005]构建步骤:使用关系型数据库根据所述三元组数据构建知识图谱;
[0006]关系查找步骤:通过所述知识图谱查找数据的关系识别出所述数据中的地址信息。
[0007]上述地址识别方法,其中,所述关系型数据库包括:
[0008]neo4j数据库、Oracle数据库、DB2数据库、MySQ本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种地址识别方法,其特征在于,包括:数据准备步骤:使用NER对采集的样本地址信息进行识别后生成三元组数据;构建步骤:使用关系型数据库根据所述三元组数据构建知识图谱;关系查找步骤:通过所述知识图谱查找数据的关系识别出所述数据中的地址信息。2.如权利要求1所述的地址识别方法,其特征在于,所述关系型数据库包括:neo4j数据库、Oracle数据库、DB2数据库、MySQL数据库和Microsoft SQL Server数据库。3.如权利要求1所述的地址识别方法,其特征在于,所述数据准备步骤包括:采集步骤:采集多个所述样本地址信息;生成三元组数据步骤:使用所述NER对多个所述样本地址信息进行识别后,并根据多个所述样本地址信息之间的关系生成所述三元组数据。4.如权利要求1所述的地址识别方法,其特征在于,所述关系查找步骤包括:当同一所述数据中包括多个待识别地址信息时,通过所述知识图谱判断多个所述待识别地址信息间是否存在包含关系;若至少两个所述待识别地址信息间存在包含关系,则同时在所述知识图谱上查找完整路径获得对应至少两个所述待识别地址信息的一所述地址信息;若至少两个所述待识别地址信息间不存在包含关系,则同时在所述知识图谱上查找完整路径获得对应每一所述待识别地址信息的一所述地址信息。5.一种地址识别系统,其特征在于,包括:数据准备模块,所述数据准备模块使用NER对采集的样本地址信息进行识别后生成三元组数据;构建模块,所述构建模块使用关系型数据库根据所述三元组数据构建知识图谱;关系查找模...

【专利技术属性】
技术研发人员:安达唐大闰
申请(专利权)人:上海明略人工智能集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1