一种地址搜索方法和设备技术

技术编号:13187274 阅读:64 留言:0更新日期:2016-05-11 17:16
本发明专利技术公开了一种地址搜索方法和设备,包括:获取地址搜索请求信息,并确定所述地址搜索请求信息中包含的待搜索的目标地址信息;将所述目标地址信息拆分为至少一个子地址信息,所述目标地址信息为由多个不同的子地址信息组成的,所述多个不同的子地址信息分别对应不同的地址类型;将所述至少一个子地址信息或者所述至少一子地址信息和所述目标地址信息与地址数据库中包含的不同地址信息进行匹配,所述地址数据库中存储的每一条地址信息包含构成该地址信息的不同子地址信息;将匹配得到的匹配度大于设定阈值的地址信息,作为搜索到的目标地址信息进行输出,提升了提取目标地址信息的正确率;而且有效地提高了地址匹配的正确率及地址搜索的精度。

【技术实现步骤摘要】

本专利技术涉及数据处理
,尤其涉及一种地址搜索方法和设备
技术介绍
随着通信技术和终端技术的发展,越来越多的应用依赖移动终端。尤其是导航类应用。例如:用户可以通过语音方式或者文字输入方式向移动终端发起导航请求,由导航类应用根据接收到的导航请求选择导航路线,并将选择的导航路线推送给用户。具体地,导航类应用根据接收到的导航请求选择导航路线的方式包括但不限于:当所述导航请求以文字形式输入时,采用CRF(英文:Condit1n RandomField ;中文:条件随机场)算法,从接收到的导航请求中提取地址名称、建筑名称/单位名称,利用提取出的地址名称、建筑名称/单位名称确定导航请求的目标地址。当所述导航请求以语音形式输入时,以该语音中包含的地址信息作为搜索依据,确定导航请求的目标地址。存在的缺陷是:在确定目标地址时,单一利用从文字或者语音中提取出的地址名称(或者建筑名称/单位名称)和地址数据库中的地址信息进行匹配,使得确定出的目标地址集合中包含大量不相关的地址,降低了地址的搜索精度。
技术实现思路
有鉴于此,本专利技术实施例提供了一种地址搜索方法和设备,用于解决目前存在的在地址搜索过程中,搜索到大量不相关的地址,导致地址的搜索精度较低的问题。根据本专利技术的第一方面,提供了一种地址搜索方法,包括:获取地址搜索请求信息,并确定所述地址搜索请求信息中包含的待搜索的目标地址信息;将所述目标地址信息拆分为至少一个子地址信息,所述目标地址信息为由多个不同的子地址信息组成的,所述多个不同的子地址信息分别对应不同的地址类型;将所述至少一个子地址信息或者所述至少一子地址信息和所述目标地址信息与地址数据库中包含的不同地址信息进行匹配,其中,所述地址数据库中存储的每一条地址信息包含构成该地址信息的不同子地址信息;将匹配得到的匹配度大于设定阈值的地址信息,作为搜索到的目标地址信息进行输出。结合本专利技术第一方面可能的实施方式,在第一种可能的方式中,获取地址搜索请求信息,包括:接收输入的语音数据,其中,所述语音数据用以发起地址搜索;对所述语音数据进行识别,得到所述语音数据中包含的待搜索的目标地址信息。结合本专利技术第一方面可能的实施方式,或者结合本专利技术第一方面第一种可能的实施方式,在第二种可能的方式中,通过以下方式得到待搜索的目标地址信息:确定所述地址搜索请求信息中包含的至少一个关键词;针对确定的每一个关键词,执行:在预先设置的对应不同地址类型的文本地址词典中,找到包含该关键词的文本地址词典;利用用于表征找到的文本地址词典对应的地址类型的字符串,替换该关键词;利用用以表示地址信息的正则表达式,判断每一个关键词被替换为对应的字符串后构成的字符串组是否表示地址信息;在确定所述字符串组表示地址信息时,根据所述字符串组确定待搜索的目标地址信息对应的准地址字符串; 将所述准地址字符串作为一个条件随机场CRF特征,基于CRF算法在所述地址搜索请求息中提取待搜索的目标地址信息。结合本专利技术第一方面第二种可能的实施方式,在第三种可能的实施方式中,根据所述字符串组确定待搜索的目标地址信息对应的准地址字符串,包括:确定所述字符串组包含的字符串为多个、且在多个字符串分别替换的关键词在所述地址搜索请求信息中位置连续;若多个字符串不存在重复时,将所述多个字符串基于替换的关键词的位置连续性合并为一个字符串组,作为待搜索的目标地址信息对应的准地址字符串;若多个字符串存在重复时,去除重复的字符串,并将去除重复的字符串后的至少一个字符串基于替换的关键词的位置连续性合并为一个字符串组,作为待搜索的目标地址信息对应的准地址字符串。结合本专利技术第一方面可能的实施方式,或者结合本专利技术第一方面第一种可能的实施方式,或者结合本专利技术第一方面第二种可能的实施方式,或者结合本专利技术第一方面第三种可能的实施方式,在第四种可能的方式中,将所述目标地址信息拆分为至少一个子地址信息,包括:根据预先设置的对应不同地址类型的文本地址词典所表示的地址类型,从所述目标地址信息中拆分出对应不同地址类型的子地址信息。结合本专利技术第一方面可能的实施方式,或者结合本专利技术第一方面第一种可能的实施方式,或者结合本专利技术第一方面第二种可能的实施方式,或者结合本专利技术第一方面第三种可能的实施方式,或者结合本专利技术第一方面第四种可能的实施方式,在第五种可能的方式中,所述地址类型包括下述中的一种或多种信息组合:行政区域信息、道路名称信息、建筑/单位名称信息、所述道路名称的附属内容、所述建筑/单位名称的附属内容。结合本专利技术第一方面可能的实施方式,或者结合本专利技术第一方面第一种可能的实施方式,或者结合本专利技术第一方面第二种可能的实施方式,或者结合本专利技术第一方面第三种可能的实施方式,或者结合本专利技术第一方面第四种可能的实施方式,或者结合本专利技术第一方面第五种可能的实施方式,在第六种可能的方式中,将所述至少一个子地址信息或者所述至少一子地址信息和所述目标地址信息与地址数据库中包含的不同地址信息进行匹配,包括:将所述目标地址信息中的至少一个子地址信息分别与所述地址数据库中地址类型相同的子地址信息进行相应匹配。结合本专利技术第一方面可能的实施方式,或者结合本专利技术第一方面第一种可能的实施方式,或者结合本专利技术第一方面第二种可能的实施方式,或者结合本专利技术第一方面第三种可能的实施方式,或者结合本专利技术第一方面第四种可能的实施方式,或者结合本专利技术第一方面第五种可能的实施方式,在第七种可能的方式中,将所述至少一个子地址信息或者所述至少一子地址信息和所述目标地址信息与地址数据库中包含的不同地址信息进行匹配,包括:从地址数据库中选择一个地址信息,确定选择的地址信息中包含的子地址信息;分别将待搜索的目标地址中包含的至少一个子地址信息与选择的地址信息中包含的子地址信息进行匹配计算,得到第一匹配度,其中,进行匹配计算的所述待搜索的目标地址中包含的子地址信息的地址类型与选择的地址信息中包含的子地址信息的地址类型相同;根据所述第一匹配度,得到选择的地址信息与待搜索的目标地址信息的总匹配度。结合本专利技术第一方面第七种可能的实施方式,在第八种可能的方式中,根据所述第一匹配度,得到选择的地址信息与待搜索的目标地址信息的总匹配度,包括:将选择的地址信息与待搜索的目标地址信息进行匹配计算,得到第二匹配度;根据所述第一匹配度和所述第二匹配度,得到选择的地址信息与待搜索的目标地址信息的总匹配度。结合本专利技术第一方面第六种可能的实施方式,或者结合本专利技术第一方面第七种可能的实施方式,或者结合本专利技术第一方面第八种可能的实施方式,在第九种可能的方式中,将待搜索的目标地址中包含的子地址信息与选择的地址信息中包含的子地址信息进行匹配计算,得到第一匹配度,包括:针对待搜索的目标地址信息中包含的每一个子地址信息,执行:针对该子地址信息,从选择的地址信息中查找出与该子地址信息属于同一地址类型的子地址信息;计算将该子地址信息与查找到的子地址信息进行相互转换所需的编辑距离;根据待搜索的目标地址信息中包含的每一个子地址信息分别对应得到的编辑距离,计算所述第一匹配度。结合本专利技术第一方面第六种可能的实施方式,或者结合本专利技术第一方面第七种可能的实施方式,或者结合本专利技术第一方面第八种可能的实施方式,或者结合本专利技术第一方面本文档来自技高网...

【技术保护点】
一种地址搜索方法,其特征在于,包括:获取地址搜索请求信息,并确定所述地址搜索请求信息中包含的待搜索的目标地址信息;将所述目标地址信息拆分为至少一个子地址信息,所述目标地址信息为由多个不同的子地址信息组成的,所述多个不同的子地址信息分别对应不同的地址类型;将所述至少一个子地址信息或者所述至少一子地址信息和所述目标地址信息与地址数据库中包含的不同地址信息进行匹配,其中,所述地址数据库中存储的每一条地址信息包含构成该地址信息的不同子地址信息;将匹配得到的匹配度大于设定阈值的地址信息,作为搜索到的目标地址信息进行输出。

【技术特征摘要】

【专利技术属性】
技术研发人员:齐泉张九龙李航
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1