一种POI信息获取的方法及装置制造方法及图纸

技术编号:26171038 阅读:21 留言:0更新日期:2020-10-31 13:41
本申请提供一种POI信息获取的方法及装置;该方法包括:获取用户通过客户端输入的检索信息,并将检索信息输入预先训练的命名实体识别模型中,识别检索信息中的命名实体;若识别出的命名实体中包括用于表征地理位置的目标命名实体,则根据目标命名实体确定目标检索区域;目标检索区域以与目标命名实体对应的POI信息为中心;根据命名实体中除目标命名实体的其他命名实体,从目标检索区域内检索并获取与检索信息对应的至少一条目标POI信息。该方法能够通过对检索信息中实体的类别进行识别,并通过识别出的能够表征地理位置的目标命名实体和其他命名实体进行分步检索获取目标POI信息,提升POI信息获取的准确率。

【技术实现步骤摘要】
一种POI信息获取的方法及装置
本申请涉及信息检索
,具体而言,涉及一种POI信息获取的方法及装置。
技术介绍
信息检索在很多领域占据着重要的地位。在很多应用场景中,会根据用户输入的检索信息为用户检索获取和展示多个检索结果。例如在网约车领域,用户会通过客户端的人机交互界面输入用于描述其目的地的检索信息,客户端客户端会根据用户输入的检索信息进行POI的获取。在数据库中,兴趣点(PointofInterest,POI)的存储形式一般为:建筑物(或者目标地)的名称与该名称对应的地理位置坐标。检索结果的获取方式一般为基于用户输入的检索信息中的关键词,与数据库中存储的一定区域范围内的各个POI进行匹配,并将匹配成功的POI作为检索结果进行获取。关键词一般为检索信息中的命名实体,命名实体主要包括人名、地名、机构名、专有名词等。POI的命名实体类型通常为地名、机构名或者专有名词。但是实际上,用户在检索时输入的检索信息通常会包括两个或者多个命名实体;当前的检索策略存在获取检索信息对应的检索结果时,往往无法挖掘出检索信息的潜在涵义,所获取的检索结果往往并非是用户想要真正获得的结果,存在获取POI获取准确率低的问题。
技术实现思路
有鉴于此,本申请的目的在于提供一种POI信息获取的方法及装置,能够通过对检索信息中实体的类别进行识别,并通过识别出的能够表征地理位置的目标命名实体和其他命名实体进行分步检索获取目标POI信息,提升POI信息获取的准确率。第一方面,提供一种兴趣点POI信息获取的方法,该信息获取方法包括:获取用户通过客户端输入的检索信息,并将所述检索信息输入预先训练的命名实体识别模型中,识别所述检索信息中的命名实体;若识别出的所述命名实体中包括用于表征地理位置的目标命名实体,则根据所述目标命名实体确定目标检索区域;所述目标检索区域以与所述目标命名实体对应的POI信息为中心;根据所述命名实体中除所述目标命名实体的其他命名实体,从所述目标检索区域内检索并获取与所述检索信息对应的至少一条目标POI信息。一种可选实施方式中,采用下述方式训练所述命名实体识别模型:获取多个样本文本,以及与每个所述样本文本对应的标签标注序列;所述标签标注序列中包括多个与构成所述样本文本的多个字符串一一对应的实体类型标注标签;针对每个所述样本文本,将该样本文本输入至条件随机场模型,确定与该样本文本对应的多个标签预测序列中每个标签预测序列分别对应的得分;所述标签标注序列为多个所述标签预测序列中的一个;根据所述得分,对所述条件随机场模型进行训练,得到所述命名实体识别模型。一种可选实施方式中,所述确定与所述样本文本对应的多个标签预测序列中每个标签预测序列分别对应的得分,包括:基于所述条件随机场模型,针对每个标签预测序列,根据概率转移矩阵,确定该标签预测序列中每两个位置相邻的预测标签对应的转移概率;根据该标签预测序列中每两个位置相邻的预测标签对应的转移概率,确定该标签预测序列对应的得分。一种可选实施方式中,所述根据所述得分,对所述条件随机场模型进行训练,包括:根据各个所述标签预测序列对应的得分,以及与所述标签标注序列对应的标签预测序列的得分,确定模型损失;根据所述模型损失,调整所述条件随机场模型的参数,完成对所述条件随机场模型的本轮训练;将经过多轮训练的条件随机场模型确定为所述命名实体识别模型。一种可选实施方式中,所述根据所述目标命名实体确定目标检索区域,包括:根据所述目标命名实体进行检索并获取与所述目标命名实体对应的至少一条POI信息;所述POI信息中包括POI名称以及地理位置信息;针对各条所述POI信息,以该POI信息中的地理位置信息为中心,确定与该POI信息对应的区域范围;将各条所述POI信息分别对应的区域范围,确定为所述目标检索区域。一种可选实施方式中,所述根据所述目标命名实体进行检索并获取与所述目标命名实体对应的至少一条POI信息,包括:以所述目标命名实体为检索的关键字,从POI数据库中获取多条与所述目标命名实体相关的备选POI信息;确定各条备选POI信息与所述目标命名实体的相关度;根据各条备选POI信息与所述目标命名实体的相关度大小,所述备选POI信息中选择至少一条与所述目标命名实体对应的POI信息。一种可选实施方式中,所述确定各条备选POI信息与所述目标命名实体的相关度,包括:基于客户端的当前位置信息,与各条所述备选POI信息中的地理位置信息,确定各条所述备选POI信息与所述目标命名实体的相关度;或者,基于所述目标命名实体,与各条所述备选POI中的POI名称中相同字符的数量,确定各条所述备选POI信息与所述目标命名实体的相关度。一种可选实施方式中,所述根据所述目标命名实体进行检索并获取与所述目标命名实体对应的至少一条POI信息,包括:以所述目标命名实体为检索的关键字,从POI数据库中获取多条与所述目标命名实体相关的备选POI信息;按照各条所述备选POI信息中的地理位置信息,对各条所述备选POI信息进行聚类,形成多个POI组;其中,每个所述POI组中的任一一条备选POI信息与该POI组中至少一条其他POI信息之间的距离不大于预设的距离阈值;针对每个所述POI组,根据该POI组中的各条备选信息,确定与所述目标命名实体对应的POI信息。一种可选实施方式中,所述针对每个所述备选POI组中包含的各个备选POI信息,确定与所述目标命名实体对应的POI信息,包括:针对每个备选POI组,若该备选POI组中备选POI信息的数量为1,则将该备选POI组中的备选POI信息确定为与所述目标命名实体对应的POI信息;若该备选POI组中备选POI信息的数量大于1,则根据该备选POI组中各条备选POI信息中的地理位置信息,确定该备选POI组对应的中心POI信息,并将该中心POI信息确定为与所述目标命名实体对应的POI信息。一种可选实施方式中,所述根据所述目标命名实体确定目标检索区域之前,还包括:判断识别出的所述命名实体中,是否包括除所述目标命名实体的其他命名实体;所述根据所述目标命名实体确定目标检索区域,包括:在识别出的所述命名实体中包括除所述目标命名实体的其他命名实体时,根据所述目标命名实体确定所述目标检索区域;在识别出的所述命名实体中不包括除所述目标命名实体的其他命名实体时,根据所述目标命名实体进行检索获取与所述检索信息对应的至少一条目标POI信息。第二方面,提供一种兴趣点POI信息获取装置,该信息获取装置包括:识别模块,用于获取用户通过客户端输入的检索信息,并将所述检索信息输入预先训练的命名实体识别模型中,识别所述检索信息中的命名实体;确定模块,用于在识别出的所述命名实体中包括用于表征地理位置的目标命名实体时,根据所述目标命名实体确定目标检索区域本文档来自技高网...

【技术保护点】
1.一种兴趣点POI信息获取的方法,其特征在于,该POI信息获取方法包括:/n获取用户通过客户端输入的检索信息,并将所述检索信息输入预先训练的命名实体识别模型中,识别所述检索信息中的命名实体;/n若识别出的所述命名实体中包括用于表征地理位置的目标命名实体,则根据所述目标命名实体确定目标检索区域;所述目标检索区域以与所述目标命名实体对应的POI信息为中心;/n根据所述命名实体中除所述目标命名实体的其他命名实体,从所述目标检索区域内检索并获取与所述检索信息对应的至少一条目标POI信息。/n

【技术特征摘要】
1.一种兴趣点POI信息获取的方法,其特征在于,该POI信息获取方法包括:
获取用户通过客户端输入的检索信息,并将所述检索信息输入预先训练的命名实体识别模型中,识别所述检索信息中的命名实体;
若识别出的所述命名实体中包括用于表征地理位置的目标命名实体,则根据所述目标命名实体确定目标检索区域;所述目标检索区域以与所述目标命名实体对应的POI信息为中心;
根据所述命名实体中除所述目标命名实体的其他命名实体,从所述目标检索区域内检索并获取与所述检索信息对应的至少一条目标POI信息。


2.根据权利要求1所述的的方法,其特征在于,采用下述方式训练所述命名实体识别模型:
获取多个样本文本,以及与每个所述样本文本对应的标签标注序列;所述标签标注序列中包括多个与构成所述样本文本的多个字符串一一对应的实体类型标注标签;
针对每个所述样本文本,将该样本文本输入至条件随机场模型,确定与该样本文本对应的多个标签预测序列中每个标签预测序列分别对应的得分;所述标签标注序列为多个所述标签预测序列中的一个;
根据所述得分,对所述条件随机场模型进行训练,得到所述命名实体识别模型。


3.根据权利要求2所述的的方法,其特征在于,所述确定与所述样本文本对应的多个标签预测序列中每个标签预测序列分别对应的得分,包括:
基于所述条件随机场模型,针对每个标签预测序列,根据概率转移矩阵,确定该标签预测序列中每两个位置相邻的预测标签对应的转移概率;
根据该标签预测序列中每两个位置相邻的预测标签对应的转移概率,确定该标签预测序列对应的得分。


4.根据权利要求2所述的方法,其特征在于,所述根据所述得分,对所述条件随机场模型进行训练,包括:
根据各个所述标签预测序列对应的得分,以及与所述标签标注序列对应的标签预测序列的得分,确定模型损失;
根据所述模型损失,调整所述条件随机场模型的参数,完成对所述条件随机场模型的本轮训练;
将经过多轮训练的条件随机场模型确定为所述命名实体识别模型。


5.根据权利要求1所述的方法,其特征在于,所述根据所述目标命名实体确定目标检索区域,包括:
根据所述目标命名实体进行检索并获取与所述目标命名实体对应的至少一条POI信息;所述POI信息中包括POI名称以及地理位置信息;
针对各条所述POI信息,以该POI信息中的地理位置信息为中心,确定与该POI信息对应的区域范围;
将各条所述POI信息分别对应的区域范围,确定为所述目标检索区域。


6.根据权利要求5所述的方法,其特征在于,所述根据所述目标命名实体进行检索并获取与所述目标命名实体对应的至少一条POI信息,包括:
以所述目标命名实体为检索的关键字,从POI数据库中获取多条与所述目标命名实体相关的备选POI信息;
确定各条备选POI信息与所述目标命名实体的相关度;
根据各条备选POI信息与所述目标命名实体的相关度大小,所述备选POI信息中选择至少一条与所述目标命名实体对应的POI信息。


7.根据权利要求6所述的方法,其特征在于,所述确定各条备选POI信息与所述目标命名实体的相关度,包括:
基于客户端的当前位置信息,与各条所述备选POI信息中的地理位置...

【专利技术属性】
技术研发人员:陶言祺陈欢
申请(专利权)人:北京嘀嘀无限科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1