地址识别方法、装置、电子设备以及存储介质制造方法及图纸

技术编号:32473033 阅读:22 留言:0更新日期:2022-03-02 09:34
本公开提供了地址识别方法、装置、电子设备以及存储介质,涉及人工智能、计算机技术领域,尤其涉及知识图谱、深度学习、云计算领域。具体实现方案为:对用于描述事件的待识别内容进行地点实体识别,得到目标地点实体,目标地点实体包括标准化地点实体、别名地点实体和标志性地点实体其中至少之一;针对目标地点实体中每种类型的地点实体,根据地址图谱,确定与地点实体相对应的标准化地址,得到至少一个标准化地址,地址图谱包括标准化地点实体、别名地点实体和标志性地点实体,以及各地点实体之间的对应关系;从至少一个标准化地址中,确定与待识别内容相对应的第一目标标准化地址,第一目标标准化地址用于表征事件的发生地。一目标标准化地址用于表征事件的发生地。一目标标准化地址用于表征事件的发生地。

【技术实现步骤摘要】
地址识别方法、装置、电子设备以及存储介质


[0001]本公开涉及人工智能、计算机
,尤其涉及知识图谱、深度学习、云计算领域,具体地,涉及一种地址识别方法、装置、电子设备以及存储介质。

技术介绍

[0002]随着信息时代的快速发展,各种文本类、音频类信息大量产生,并成为信息的主要传播方式。基于信息可以进行舆情分析。行政区作为结构化信息中的一个信息,可以直观的展示信息的发生地,并可支撑基于行政区检索信息的功能。

技术实现思路

[0003]本公开提供了一种地址识别方法、装置、电子设备以及存储介质。
[0004]根据本公开的一方面,提供了一种地址识别方法,包括:对用于描述事件的待识别内容进行地点实体识别,得到目标地点实体,其中,所述目标地点实体包括标准化地点实体、别名地点实体和标志性地点实体其中至少之一;针对所述目标地点实体中每种类型的地点实体,根据地址图谱,确定与所述地点实体相对应的标准化地址,得到至少一个标准化地址,其中,所述地址图谱包括标准化地点实体、别名地点实体和标志性地点实体,以及各地点实体之间的对应关系;以及从本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种地址识别方法,包括:对用于描述事件的待识别内容进行地点实体识别,得到目标地点实体,其中,所述目标地点实体包括标准化地点实体、别名地点实体和标志性地点实体其中至少之一;针对所述目标地点实体中每种类型的地点实体,根据地址图谱,确定与所述地点实体相对应的标准化地址,得到至少一个标准化地址,其中,所述地址图谱包括标准化地点实体、别名地点实体和标志性地点实体,以及各地点实体之间的对应关系;以及从所述至少一个标准化地址中,确定与所述待识别内容相对应的第一目标标准化地址,其中,所述第一目标标准化地址用于表征所述事件的发生地。2.根据权利要求1所述的方法,其中,在所述目标地点实体包括标准化地点实体的情况下,所述根据地址图谱,确定与所述地点实体相对应的标准化地址包括:根据所述地址图谱,确定与所述标准化地点实体相对应的第一标准化地址;以及将所述第一标准化地址确定为与所述标准化地点实体相对应的标准化地址。3.根据权利要求1所述的方法,其中,在所述目标地点实体包括别名地点实体的情况下,所述根据地址图谱,确定与所述地点实体相对应的标准化地址包括:根据所述地址图谱,确定与所述别名地点实体相对应的第一目标标准化地点实体;根据所述地址图谱,确定与所述第一目标标准化地点实体相对应的第二标准化地址;以及将所述第二标准化地址确定为与所述别名地点实体相对应的标准化地址。4.根据权利要求1所述的方法,其中,在所述目标地点实体包括标志性地点实体的情况下,所述根据地址图谱,确定与所述地点实体相对应的标准化地址包括:确定所述地址图谱中的与所述标志性地点实体的相似度大于第一预设阈值的目标标志性地点实体;根据所述地址图谱,确定与所述目标标志性地点实体相对应的第二目标标准化地点实体;根据所述地址图谱,确定与所述第二目标标准化地点实体相对应的第三标准化地址;以及将所述第三标准化地址确定为与所述标志性地点实体相对应的标准化地址。5.根据权利要求1所述的方法,其中,所述从所述至少一个标准化地址中,确定与所述待识别内容相对应的第一目标标准化地址包括:针对每个所述标准化地址中的每个地点实体,确定所述地点实体在所述至少一个标准化地址中的第一出现频次;针对每个所述标准化地址,根据所述标准化地址中的每个地点实体所对应的第一出现频次中的最大频次,确定与所述标准化地址相对应的目标频次,得到与所述至少一个标准化地址相对应的至少一个目标频次;从所述至少一个目标频次中,确定最大目标频次;以及将与所述最大目标频次相对应的标准化地址确定为所述第一目标标准化地址。6.根据权利要求1所述的方法,其中,所述与所述最大目标频次相对应的标准化地址包括多个标准化地址;所述将与所述最大目标频次相对应的标准化地址确定为所述第一目标标准化地址包
括:将所述多个标准化地址中包括的地点实体的数目最多的标准化地址确定为所述第一目标标准化地址。7.根据权利要求1所述的方法,还包括:在用于描述所述事件的待识别内容的数目包括多个的情况下,针对每个所述待识别内容,确定与所述待识别内容相对应的第一目标标准化地址,得到多个第一目标标准化地址;确定与所述事件相对应的预设字段信息;以及在确定存在与所述预设字段信息相对应的第二目标标准化地址,且所述多个第一目标标准化地址和所述第二目标标准化地址之间存在相同的标准化地址的情况下,根据所述多个第一目标标准化地址和所述第二目标标准化地址,确定用于表征所述事件的发生地的第三目标标准化地址。8.根据权利要求7所述的方法,其中,所述根据所述多个第一目标标准化地址和所述第二目标标准化地址,确定用于表征所述事件的发生地的第三目标标准化地址包括:在所述相同的标准化地址中包括一个标准化地址的情况下,将所述相同的标准化地址确定为所述第三目标标准化地址。9.根据权利要求7所述的方法,其中,所述标准化地点实体包括县级地点实体、地级地点实体和省级地点实体其中至少之一;所述根据所述多个第一目标标准化地址和所述第二目标标准化地址,确定用于表征所述事件的发生地的第三目标标准化地址包括:在所述相同的标准化地址包括多个标准化地址,且所述相同的标准化地址包括至少一个第一县级地点实体的情况下,从所述相同的标准化地址中,获取与满足第一预设条件的第一县级地点实体相对应的标准化地址,确定为所述第三目标标准化地址;在所述相同的标准化地址包括多个标准化地址,且所述相同的标准化地址包括至少一个第一地级地点实体且不包括第一县级地点实体的情况下,从所述相同的标准化地址中,获取与满足第二预设条件的第一地级地点实体相对应的标准化地址,确定为所述第三目标标准化地址;以及在所述相同的标准化地址包括多个标准化地址,且所述相同的标准化地址包括第一省级地点实体且不包括第一县级地点实体和第一地级地点实体的情况下,从所述相同的标准化地址中,获取与满足第三预设条件的第一省级地点实体相对应的标准化地址,确定为所述第三目标标准化地址。10.根据权利要求9所述的方法,其中,所述多个第一目标标准化地址中包括至少一个第二县级地点实体和至少一个第二地级地点实体;所述从所述相同的标准化地址中,获取与满足第一预设条件的第一县级地点实体相对应的标准化地址,确定为所述第三目标标准化地址包括:针对每个所述第二县级地点实体,确定所述第二县级地点实体在所述多个第一目标标准化地址中的第二出现频次;从所述至少一个第二县级地点实体中,确定所述第二出现频次的数值最高的预设数目个目标第二县级地点实体;针对每个所述第二地级地点实体,确定所述第二地级地点实体在所述多个第一目标标
准化地址中的第三出现频次;从所述至少一个第二地级地点实体中,确定所述第三出现频次的数值最高的预设数目个目标第二地级地点实体;在所述至少一个第一县级地点实体中存在与所述目标第二县级地点实体相同的目标第一县级地点实体的情况下,确定与所述目标第一县级地点实体相对应的第一目标地级地点实体;以及在所述目标第二地级地点实体中包括所述第一目标地级地点实体的情况下,将与所述目标第一县级地点实体和所述第一目标地级地点实体相对应的标准化地址确定为所述第三目标标准化地址。11.根据权利要求9所述的方法,其中,所述多个第一目标标准化地址中包括至少一个第三地级地点实体;所述从所述相同的标准化地址中,获取与满足第二预设条件的第一地级地点实体相对应的标准化地址...

【专利技术属性】
技术研发人员:徐思琪潘旭刘晨晖龚建卓泽城
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1