地址查询方法、获取地理编码预测模型的方法及对应装置制造方法及图纸

技术编号:33705166 阅读:49 留言:0更新日期:2022-06-06 08:25
本申请实施例公开了一种地址查询方法、获取地理编码预测模型的方法及对应装置。具体技术方案包括:获取检索词,所述检索词包括地址描述文本;利用预先训练得到的地理编码预测模型,预测所述地址描述文本对应的地理编码信息;将预测得到的地理编码信息与地理位置数据库中各地理位置的地理编码信息进行匹配,得到第一地理位置信息;利用所述第一地理位置信息生成查询结果。本申请能够提高地址查询的容错能力。能力。能力。

【技术实现步骤摘要】
地址查询方法、获取地理编码预测模型的方法及对应装置


[0001]本申请涉及计算机
,特别是涉及一种地址查询方法、获取地理编码预测模型的方法及对应装置。

技术介绍

[0002]对于地图类应用而言,地址查询是用户使用最频繁的功能之一。用户通常可以通过文本或语音的形式输入检索词来查询地址,其中检索词通常为一个地址描述文本。现有地址查询方法大多采用检索词与地理位置的信息进行字面匹配方式进行检索,先识别检索词中的区划部分(例如省、市、区等),再在对应区划对应的地理位置数据中采用字面匹配的方式查询地址信息。这种方式对于存在区划错误的检索词会出现无法召回查询结果的情况。例如,当用户输入检索词“重庆鸟巢国家体育场”、“海淀区鸟巢国家体育场”时,是无法在重庆市的所有地理位置以及海淀区的所有地理位置中检索到“鸟巢国家体育场”的。

技术实现思路

[0003]有鉴于此,本申请提供了一种地址查询方法、获取地理编码预测模型的方法及对应装置,以便于提升地址查询的容错性。
[0004]本申请提供了如下方案:
[0005]根据第一方面,提供本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.地址查询方法,包括:获取检索词,所述检索词包括地址描述文本;利用预先训练得到的地理编码预测模型,预测所述地址描述文本对应的地理编码信息;将预测得到的地理编码信息与地理位置数据库中各地理位置的地理编码信息进行匹配,得到第一地理位置信息;利用所述第一地理位置信息生成查询结果。2.根据权利要求1所述的方法,该方法还包括:预先对地理位置数据库中的各地理位置进行地理编码,并存储得到的各地理位置的地理编码信息。3.根据权利要求1或2所述的方法,其中,所述地理编码包括Geohash编码。4.根据权利要求1所述的方法,该方法还包括采用如下方式预先训练得到地理编码预测模型:获取包含多个训练样本的训练数据,所述训练样本包括地址描述样本及其对应的地理编码样本;利用所述训练数据训练分类模型,得到所述地理编码预测模型;其中,利用地址描述样本生成输入序列以作为所述分类模型的输入,将该地址描述样本对应的地理编码样本作为所述分类模型的目标输出。5.根据权利要求4所述的方法,其中,所述获取包含多个训练样本的训练数据包括:获取用户查询日志;从所述用户查询日志选择检索词作为地址描述样本,确定该检索词对应的被点击查询结果,利用被点击查询结果对应的地理编码信息得到该地理描述样本对应的地理编码样本。6.根据权利要求4所述的方法,其中,所述分类模型包括转换Transformer编码器、池化层和分类层;所述Transformer编码器用以对所述输入序列中的各字符Token进行编码,得到各Token对应的向量表示;所述池化层用以对所述各Token对应的向量表示进行池化处理;所述分类层用以将池化处理后得到的向量表示映射至地理编码空间,预测得到地理编码信息。7.根据权利要求1所述的方法,该方法还包括:识别所述地址描述文本中的区划部分;将所述地址描述文本中除所述区划部分以外的其他部分,在地理位置数据库中所述区划部分对应的地理位置数据中进行字面匹配,得到第二地理位置信息;利用所述第一地理位置信息生成查询结果包括:利用所述第一地理位置信息和所述第二地理位置信息生成查询结果。8.根据权利要求7所述的方法,其中,利用所述第一地理位置信息和所述第二地理位置信息生成查询结果包括:对所述第一地理位置信息和所述第二地理位置信息进行去重处理;对所述去重处理后得到的地理位置信息进行排序后,按照排序结果生成所述查询结
果。9.获取地理编码预测模型的方法,包括:获取包含多个训练样本的训练数据,所述训练样本包括地址描述样本及其对应的地理编码样本;利用所述训练数据...

【专利技术属性】
技术研发人员:丁瑞雪刘楚黄申王潇斌龙定坤高琼陈博理谢朋峻黄非
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1