文章地域识别方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:29156585 阅读:20 留言:0更新日期:2021-07-06 22:55
本公开公开了文章地域识别方法、装置、电子设备及可读存储介质,涉及计算机视觉、知识图谱以及自然语言处理等人工智能领域,其中的方法可包括:针对预定地域范围,构建树状结构的地域图谱,地域图谱中的各节点分别为一个地域词,并且,对于地域图谱中从根节点开始到任一叶节点结束的任一路径,所述路径上的各非根节点分别为其父节点的下属区域;针对待识别的文章,从地域图谱中的各非根节点中筛选出与文章相匹配的节点;根据筛选出的节点所在的路径确定出文章的地域识别结果。应用本公开所述方案,可提升识别结果的准确性等。

【技术实现步骤摘要】
文章地域识别方法、装置、电子设备及可读存储介质
本公开涉及人工智能
,特别涉及计算机视觉、知识图谱以及自然语言处理等领域的文章地域识别方法、装置、电子设备及可读存储介质。
技术介绍
文章地域识别是指识别出文章中所发生之事的发生地点。传统的文章地域识别方式多为基于地域词表的识别方式,地域词表中可包括一些预先挖掘的地域词,并直接和文章中的文本片段进行匹配,若命中,则将命中的地域词作为文章的地域识别结果。但这种方式的准确性通常较差。
技术实现思路
本公开提供了文章地域识别方法、装置、电子设备及可读存储介质。一种文章地域识别方法,包括:针对预定地域范围,构建树状结构的地域图谱,所述地域图谱中的各节点分别为一个地域词,并且,对于所述地域图谱中从根节点开始到任一叶节点结束的任一路径,所述路径上的各非根节点分别为其父节点的下属区域;针对待识别的文章,从所述地域图谱中的各非根节点中筛选出与所述文章相匹配的节点;根据筛选出的节点所在的路径确定出所述文章的地域识别结果。一种文章地域识别装置,包括:图本文档来自技高网...

【技术保护点】
1.一种文章地域识别方法,包括:/n针对预定地域范围,构建树状结构的地域图谱,所述地域图谱中的各节点分别为一个地域词,并且,对于所述地域图谱中从根节点开始到任一叶节点结束的任一路径,所述路径上的各非根节点分别为其父节点的下属区域;/n针对待识别的文章,从所述地域图谱中的各非根节点中筛选出与所述文章相匹配的节点;/n根据筛选出的节点所在的路径确定出所述文章的地域识别结果。/n

【技术特征摘要】
1.一种文章地域识别方法,包括:
针对预定地域范围,构建树状结构的地域图谱,所述地域图谱中的各节点分别为一个地域词,并且,对于所述地域图谱中从根节点开始到任一叶节点结束的任一路径,所述路径上的各非根节点分别为其父节点的下属区域;
针对待识别的文章,从所述地域图谱中的各非根节点中筛选出与所述文章相匹配的节点;
根据筛选出的节点所在的路径确定出所述文章的地域识别结果。


2.根据权利要求1所述的方法,其中,
所述地域图谱中的各非根节点属于M个不同的级别,M为大于一的正整数;对于任一路径上的各非根节点,越为靠近所述根节点的非根节点所属的级别越高;
所述从所述地域图谱中的各非根节点中筛选出与所述文章相匹配的节点包括:按照不同级别分别对应的筛选方式,从所述地域图谱中的各非根节点中筛选出与所述文章相匹配的节点。


3.根据权利要求2所述的方法,其中,
所述按照不同级别分别对应的筛选方式,从所述地域图谱中的各非根节点中筛选出与所述文章相匹配的节点包括:
对于所述地域图谱中第一级别到第N级别中的任一级别的任一节点,分别确定所述节点是否出现在所述文章中,若是,则将所述节点作为筛选出的节点,N为大于一的正整数,且小于M,第N-1级别高于第N级别。


4.根据权利要求3所述的方法,其中,
所述按照不同级别分别对应的筛选方式,从所述地域图谱中的各非根节点中筛选出与所述文章相匹配的节点包括:
对所述文章进行命名实体识别,对于识别到的任一地名,若确定所述地名为所述地域图谱中第N+1级别到第M级别中的任一级别的节点,则将所述节点作为筛选出的节点。


5.根据权利要求2所述的方法,其中,所述根据筛选出的节点所在的路径确定出所述文章的地域识别结果包括:
对于筛选出的任一节点,分别将所述节点所在路径上的预定节点到根节点之间的子路径作为获取到的候选支线,所述预定节点为所述路径上级别最低的筛选出的节点;
若仅获取到一个候选支线,则将所述候选支线上的节点作为所述文章的地域识别结果;
若获取到大于一个候选支线,则分别获取各候选支线的评分,将评分最高的候选支线上的节点作为所述文章的地域识别结果。


6.根据权利要求5所述的方法,其中,所述分别获取各候选支线的评分包括:
针对任一候选支线,分别根据所述候选支线的长度、所述候选支线中的节点在所述文章中的出现次数以及所述候选支线中的节点在所述文章的标题中的出现位置,确定出所述候选支线的评分。


7.一种文章地域识别装置,包括:图谱构建模块、节点筛选模块以及结果获取模块;
所述图谱构建模块,用于针对预定地域范围,构建树状结构的地域图谱,所述地域图谱中的各节点分别为...

【专利技术属性】
技术研发人员:徐扬王德瑞李东辉
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1