【技术实现步骤摘要】
地点抽取方法、装置、设备以及存储介质
本申请涉及人工智能
,尤其智能搜索、知识图谱和深度学习技术,具体涉及一种地点抽取方法、装置、设备以及存储介质。
技术介绍
在从文章中进行舆情信息提取的时候,往往需要进行舆情相关地点的提取。由于当前存在不同地点命名相同的问题。所以当提取地点的粒度较粗时,读者无法根据粗粒度的地点进行舆情信息的准确定位。例如,红旗大街,多个城市均有以此命名的道路。当提取到红旗大街时,读者并不清楚具体是哪个城市的红旗大街。
技术实现思路
本公开提供了一种地点抽取方法、装置、设备以及存储介质。根据本公开的一方面,提供了一种地点抽取方法,包括:识别目标文本中的至少两个地点实体;确定所述至少两个地点实体之间的属性关系;根据所述属性关系,建立所述至少两个地点实体之间的关联关系,得到与所述目标文本关联的地点链。根据本公开的另一方面,提供了一种地点抽取装置,包括:实体识别模块,用于识别目标文本中的至少两个地点实体;关系确定模块,用于确定所述至 ...
【技术保护点】
1.一种地点抽取方法,包括:/n识别目标文本中的至少两个地点实体;/n确定所述至少两个地点实体之间的属性关系;/n根据所述属性关系,建立所述至少两个地点实体之间的关联关系,得到与所述目标文本关联的地点链。/n
【技术特征摘要】
1.一种地点抽取方法,包括:
识别目标文本中的至少两个地点实体;
确定所述至少两个地点实体之间的属性关系;
根据所述属性关系,建立所述至少两个地点实体之间的关联关系,得到与所述目标文本关联的地点链。
2.根据权利要求1所述的方法,其中,所述确定所述至少两个地点实体之间的属性关系,包括:
组合所述至少两个地点实体,得到至少一个地点对;
识别所述地点对中两地点实体之间的属性关系。
3.根据权利要求2所述的方法,其中,所述识别所述地点对中两地点实体之间的属性关系,包括:
将所述地点对中两地点实体输入预先训练的属性识别模型,输出所述地点对中两地点之间的属性关系;
其中所述属性识别模型利用存在属性关系的地点对作为正样本训练得到。
4.根据权利要求1-3中任一所述的方法,所述根据所述属性关系,建立所述至少两个地点实体之间的关联关系,得到与所述目标文本关联的地点链之后,所述方法还包括:
利用知识图谱中的地点链对所述目标文本关联的地点链进行补充,得到目标地点链。
5.根据权利要求4所述的方法,其中,所述利用知识图谱中的地点链对所述目标文本关联的地点链进行补充,得到目标地点链,包括:
匹配知识图谱中的地点链与所述目标文本关联的地点链;
根据匹配结果,从知识图谱中的地点链中确定所述目标地点链。
6.根据权利要求5所述的方法,其中,所述根据匹配结果,从知识图谱中的地点链中确定所述目标地点链,包括:
根据匹配结果,从知识图谱中的地点链中确定至少一个候选地点链;
根据所述目标文本中除所述至少两个地点实体外的其他地点信息,从所述至少一个候选地点链中确定所述目标地点链。
7.一种地点抽取装置,包括:
实体识别模块,用于识别目标文本中的至少两个地点实体;
关系确定模块,用于确定所述至少两个地点实体之间的属性关系;
实体关联模块,用于根据所述属性关系,建立所述至少两个地...
【专利技术属性】
技术研发人员:潘旭,崔路男,李云聪,杨哲,尹存祥,方军,黄强,章文俊,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。