POI别名的探索方法、装置和车辆制造方法及图纸

技术编号:30338730 阅读:38 留言:0更新日期:2021-10-12 23:02
本公开提供一种POI别名的探索方法、装置和车辆。该方法包括:接收对象发送的携带待探索的POI名称的探索请求,从预设的POI索引库中提取与POI名称对应的POI相关名称,对POI名称进行分词处理,以便确定与对POI相关名称对应的目标分词,从预设的POI关键字模型中选取与目标分词的相似度大于预设第一阈值的目标关键字,从预设的POI别名模型中选取与目标关键字的相似度大于预设第二阈值的POI别名。通过将分词处理与POI关键字模型和POI模型相结合,即通过由分词结合匹配模型的方式实现对POI别名的探索,避免了现有技术中通过人工探索造成的效率低和准确率低等问题,进而实现提高POI别名的探索效率,并提高探索结果的可靠性的技术效果。术效果。术效果。

【技术实现步骤摘要】
POI别名的探索方法、装置和车辆


[0001]本公开涉及计算机
,具体涉及数据处理
,尤其涉及一种POI别名的探索方法、装置和车辆。

技术介绍

[0002]随着科技的发展和互联网技术的不断进步,移动终端提供的服务不断升级。目前基于位置的服务(Location Based Services,LBS)是当前移动终端服务中的热点,在LBS中,兴趣点(Point of Interest,POI)已成为衡量LBS价值的标准,实际上不同的POI具备不同的名称,名称用于标识POI。
[0003]在现有技术中,POI别名的探索方法主要通过人工的方式从官方公文发布的正式改名信息,百科网站中记载的别名内容,以及资讯等消息提取出来。
[0004]然而专利技术人在实现本公开的过程中,发现至少存在如下问题:通过人工的方式探索POI别名导致的可靠性较低。

技术实现思路

[0005]本公开提供一种POI别名的探索方法、装置和车辆,用以解决现有技术中通过人工的方式探索POI别名导致的可靠性较低的问题。
[0006]一方面,本公开实施例提供一种POI别名的探索方法,所述方法包括:
[0007]接收对象发送的携带待探索的POI名称的探索请求;
[0008]从预设的POI索引库中提取与所述POI名称对应的POI相关名称;
[0009]对所述POI相关名称进行分词处理,以便确定与对所述POI相关名称对应的目标分词;
[0010]从预设的POI关键字模型中选取与所述目标分词的相似度大于预设第一阈值的目标关键字;
[0011]从预设的POI别名模型中选取与所述目标关键字的相似度大于预设第二阈值的POI别名。
[0012]在本公开实施例中,通过将分词处理与POI关键字模型和POI模型相结合,即通过由分词结合匹配模型的方式实现对POI别名的探索,避免了现有技术中通过人工探索造成的效率低和准确率低等问题,进而实现提高POI别名的探索效率,并提高探索结果的可靠性的技术效果。
[0013]在一可选实施例中,在所述从预设的POI关键字模型中选取与所述目标分词的相似度大于预设第一阈值的目标关键字之前,所述方法还包括:
[0014]分别对预存的POI资讯信息的文档和所述POI索引库中的文档进行分词,得到第一分词;
[0015]计算所述第一分词的词频和逆文档频率;
[0016]根据所述词频和所述逆文档频率构建所述POI关键字模型。
[0017]在本公开实施例中,通过基于POI资讯信息的文档和POI索引库中的文档确定第一分词,以便实现第一分词的多样性和全面性,并通过基于第一分词的词频和逆文档频率构建POI关键字模型,以便实现精确确定各第一分词之间的关联关系,进而实现POI关键字模型的可靠性。
[0018]在一可选实施例中,所述根据所述词频和所述逆文档频率构建所述POI关键字模型包括:
[0019]根据所述词频和逆文档频率对每个文档对应的第一分词进行排序处理,得到分词序列;
[0020]针对所述每个文档的分词序列,基于词频与逆文档频率的乘积由高至低地选取预设第一数量的第一分词;
[0021]计算选取出的第一分词之间的第一相似度;
[0022]基于所述第一相似度生成所述POI关键字模型。
[0023]在本公开实施例中,根据词频和逆文档频率对每个文档的第一分词进行排序,并基于词频与逆文档频率的乘积对每个文档的第一分词进行选取,以对每个文档的第一分词进行过滤,以便在后续计算过程中节约计算资源,且通过计算出的第一相似度构建POI关键字模型,以便实现基于各第一分词之间的关联关系构建出高可靠性的POI关键字的技术效果。
[0024]在一可选实施例中,所述从预设的POI关键字模型中选取与所述目标分词的相似度大于预设第一阈值的目标关键字包括:
[0025]将所述目标分词作为键值输入至所述POI关键字模型,得到与所述目标分词的相似度大于所述第一阈值的初始关键字;
[0026]根据与所述目标分词的相似度的从大到小的顺序,从所述初始关键字中选取预设第二数量的初始关键字确定为候选关键字;
[0027]对所述候选关键字进行去重处理,得到所述目标关键字。
[0028]在本公开实施例中,通过基于相似度、第一阈值和去重,从POI关键字模型中选取与目标分词对应的目标关键字,可以实现去除部分干扰关键字,并选取出与目标分词匹配度高的关键字的技术效果。
[0029]在一可选实施例中,在所述从预设的POI别名模型中选取与所述关键字的相似度大于预设第二阈值的POI别名之前,所述方法还包括:
[0030]对所述POI索引库中的文档进行分词,得到第二分词;
[0031]基于所述第二分词的词频为所述第二分词配权重;
[0032]基于所述第二分词的顺序和所述权重形成多元组;
[0033]对所述多元组进行去重处理;
[0034]计算所述多元组的词频,以便基于多元组的词频的由高至低进行排序,得到多元组列表,并将所述多元组列表确定为所述POI别名模型。
[0035]在本公开实施例中,通过基于POI索引库中的文档生成多元组,并根据多元组的词频确定POI别名模型,可以实现各多元组之间的准确性高的关联关系,从而实现POI别名模型的可靠性。
[0036]在一可选实施例中,所述从预设的POI别名模型中选取与所述目标关键字的相似
度大于预设第二阈值的POI别名包括:
[0037]将所述目标关键字组合成多元组;
[0038]计算所述多元组与所述多元组列表中的每个多元组的第二相似度;
[0039]将第二相似度大于所述第二阈值的多元组列表中的多元组进行组合,得到所述POI别名。
[0040]在本公开实施例中,通过对目标关键字进行组合得到多元组,以便通过结合第二相似度和第二阈值确定POI别名,可以实现确定出与POI相关名称的匹配度高的POI别名,即实现确定出的POI别名的可靠性的技术效果。
[0041]另一方面,本公开实施例还提供了一种POI别名的探索装置,所述装置包括:
[0042]接收器,用于接收对象发送的携带待探索的POI名称的探索请求;
[0043]处理器,用于从预设的POI索引库中提取与所述POI名称对应的POI相关名称,对所述POI相关名称进行分词处理,以便确定与对所述POI相关名称对应的目标分词,从预设的POI关键字模型中选取与所述目标分词的相似度大于预设第一阈值的目标关键字,从预设的POI别名模型中选取与所述目标关键字的相似度大于预设第二阈值的POI别名。
[0044]在一可选实施例中,所述装置还包括所述POI关键字模型,其中,所述POI关键字模型是所述处理器分别对预存的POI资讯信息的文档和所述POI索引库中的文档进行分词,得到第一分词,并计算所述第一分词的词频和逆文档频率,并根据所述词频和所述逆文档频率构建的。...

【技术保护点】

【技术特征摘要】
1.一种POI别名的探索方法,其特征在于,所述方法包括:接收对象发送的携带待探索的POI名称的探索请求;从预设的POI索引库中提取与所述POI名称对应的POI相关名称;对所述POI相关名称进行分词处理,以便确定与对所述POI相关名称对应的目标分词;从预设的POI关键字模型中选取与所述目标分词的相似度大于预设第一阈值的目标关键字;从预设的POI别名模型中选取与所述目标关键字的相似度大于预设第二阈值的POI别名。2.根据权利要求1所述的方法,其特征在于,在所述从预设的POI关键字模型中选取与所述目标分词的相似度大于预设第一阈值的目标关键字之前,所述方法还包括:分别对预存的POI资讯信息的文档和所述POI索引库中的文档进行分词,得到第一分词;计算所述第一分词的词频和逆文档频率;根据所述词频和所述逆文档频率构建所述POI关键字模型。3.根据权利要求2所述的方法,其特征在于,所述根据所述词频和所述逆文档频率构建所述POI关键字模型包括:根据所述词频和逆文档频率对每个文档对应的第一分词进行排序处理,得到分词序列;针对所述每个文档的分词序列,基于词频与逆文档频率的乘积由高至低地选取预设第一数量的第一分词;计算选取出的第一分词之间的第一相似度;基于所述第一相似度生成所述POI关键字模型。4.根据权利要求1所述的方法,其特征在于,所述从预设的POI关键字模型中选取与所述目标分词的相似度大于预设第一阈值的目标关键字包括:将所述目标分词作为键值输入至所述POI关键字模型,得到与所述目标分词的相似度大于所述第一阈值的初始关键字;根据与所述目标分词的相似度的从大到小的顺序,从所述初始关键字中选取预设第二数量的初始关键字确定为候选关键字;对所述候选关键字进行去重处理,得到所述目标关键字。5.根据权利要求1至4中任一项所述的方法,其特征在于,在所述从预设的POI别名模型中选取与所述关键字的相似度大于预设第二阈值的POI别名之前,所述方法还包括:对所述POI索引库中的文档进行分词,得到第二分词;基于所述第二...

【专利技术属性】
技术研发人员:温亚东
申请(专利权)人:北京四维图新科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1