System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及信息,尤其涉及一种地址检索方法、装置、计算机设备及计算机可读存储介质。
技术介绍
1、随着移动互联网和信息技术的发展,人们的生活方式发生了大的改变,如电商、物流、出行等,无不与信息技术进行了完美的结合。地址检索或带地址检索的应用程序(app)应运而生。
2、需要检索地址时,用户先在应用程序输入待检索地址,该待检索地址与应用程序后台存储的地址表的地址进行比对检索,最后向用户返回gis(地理信息系统)的地理坐标地址。
3、由于现有技术地址检索方法是按句检索的,即按用户输入的待检索地址整体在应用程序中检索,只有当用户输入的待检索地址与应用程序后台地址表的地址描述完全一致时,才返回该地址对应的坐标地址。当用户输入的待检索地址与应用程序后台的地址描述不一致时,此时应用程序会自动去除用户输入的待检索地址的最后一个字符,用去除最后一个字符的待检索地址进行检索,如果去除最后一个字符的待检索地址与应用程序后台的地址描述完全一致时,返回该地址对应的坐标地址。如果用去除最后一个字符的待检索地址也与应用程序后台的地址描述不一致,则应用程序会进一步去除倒数第二个字符,以此类推,直至查找到去除字符后的待检索地址对应的应用程序后台的地址,返回该地址对应的坐标地址。
4、现有技术的按句并逐个去除待检索地址最后一个字符的方法,对用户输入地址的要求比较高,要求用户输入的地址必须与应用程序后台描述的地址完全一致才能被准确检索出来;当去除待检索地址后面太多字符后,通常会出现因地址不全而无法检索出准确的坐标地址的情况;而且,
5、针对现存方法存在的问题,急需提供一种全面、不易漏检的地址检索的方法、装置、计算机设备及计算机可读存储介质。
技术实现思路
1、本申请的目的在于提供一种全面、不易漏检的地址检索方法、装置、计算机设备及存储介质,旨在解决上述技术问题之一。
2、第一方面,本申请实施例提供了一种地址检索方法,包括:
3、获取待检索地址;
4、对所述待检索地址进行成分分析获取所述待检索地址的各成分信息;
5、去除所述待检索地址中的各所述成分信息以外的非地址信息;
6、对处理后的所述待检索地址进行检索返回目标地址;
7、各所述成分信息包括所述待检索地址的省份、地级市、行政区、道路、门牌号的信息。
8、优选地,上述去除所述待检索地址中的各所述成分信息以外的非地址信息的步骤之后还包括:删除所述待检索地址的门牌号信息中“号”字、“栋”字、“幢”字。
9、优选地,上述删除所述待检索地址的门牌号信息中“号”字、“栋”字、“幢”字的步骤之后还包括:对所述待检索地址按所述成分信息进行错别字纠错;对所述待检索地址按所述成分信息进行内容纠错。
10、优选地,上述对处理后的所述待检索地址进行检索返回目标地址具体为:设置返回目标地址的目标数量;分别设置检索获得的地址的各成分信息与所述待检索地址的对应成分信息相同时的得分p;对处理后的所述待检索地址进行分词;所述对分词后的所述待检索地址用分布式搜索和分析引擎的方法检索返回备选地址;获取所述备选地址对应的各成分信息;判断所述备选地址对应的各成分信息和所述待检索地址的对应成分信息是否相同,如果相同,获得对应的得分p;获取所述备选地址的字符数量b、所述待检索地址的字符数量d、以及所述备选地址和所述待检索地址相同字符的数量t;用公式k=(b/t+d/t)/2获得相似度得分k;用公式w=p+k获得所述备选地址的最终得分w;对所有的所述备选地址的最终得分w按高到低进行排序;返回所述最终得分w最高的所述目标数量的所述备选地址作为目标地址。
11、优选地,上述对分词后的所述待检索地址用分布式搜索和分析引擎的方法检索返回备选地址的步骤具体为:根据所述待检索地址的各成分信息获取检索意图;对分词后的所述待检索地址用分布式搜索和分析引擎的方法检索返回与所述检索意图相同的备选地址;所述检索意图包括酒店、饭店、宾馆、学校、商业广场、商铺、培训机构、企业、单位。
12、优选地,上述设置返回目标地址的目标数量的步骤之前包括:设置目标分值;所述返回所述最终得分w最高的所述目标数量的所述备选地址作为目标地址的步骤包括:
13、判断排名在前面所述目标数量的所述最终得分w是否大于所述目标分值,如果是,返回所述最终得分w对应的所述备选地址作为目标地址;如果否,不返回所述最终得分w对应的所述备选地址作为目标地址;
14、判断所述目标地址的数量是否为0:如果是,返回两个与所述待检索地址的道路相同位置相近的参考地址作为目标地址;或者进一步根据两所述参考地址分别获得两所述参考地址对应的经纬度,结合周边路形按所述待检索地址和两所述参考地址的门牌号按比例推理获得所述备选地址的经纬度,返回所述备选地址作为目标地址。
15、优选地,上述对所述待检索地址进行成分分析获取所述待检索地址的各成分信息具体包括:获取历史待检索地址作为训练数据;设置crf++模型;用所述训练数据训练所述crf++模型;输入所述待检索地址,通过训练后的所述crf++模型进行成分分析获取所述待检索地址的各成分信息;
16、所述删除所述待检索地址的门牌号信息中“号”字、“栋”字、“幢”字具体包括:设置textcnn模型;用所述训练数据训练所述textcnn模型;输入所述待检索地址,通过训练后的所述textcnn模型进行各成分信息结构化,将各所述成分信息拆分为名称和成分名,删除所述待检索地址的门牌号信息中“号”字、“栋”字、幢”字;
17、所述对处理后的所述待检索地址进行分词具体包括:设置第一bert模型;用所述训练数据训练所述第一bert模型;输入处理后的所述待检索地址,通过训练后的所述第一bert模型对处理后的所述待检索地址进行分词;
18、所述对所述待检索地址按所述成分信息进行错别字纠错具体包括:设置第二bert模型;用所述训练数据训练所述第二bert模型;输入所述待检索地址,通过训练后的所述第二bert模型按成分信息对所述待检索地址进行错别字纠错;
19、所述对所述待检索地址按所述成分信息进行内容纠错具体包括:设置fasttext模型;用所述训练数据训练所述fasttext模型;输入所述待检索地址,通过训练后的所述fasttext模型按成分信息对所述待检索地址进行内容纠错。
20、第二方面,本申请实施例提供了一种地址检索装置,包括:检索地址模块,用于获取待检索地址;成分分析模块,用于对所述待检索地址进行成分分析获取所述待检索地址的各成分信息;去除无用模块,用于去除所述待检索地址中的各所述成分信息以外的非地址信息;目标检索模块,用于对处理后的所述待检索本文档来自技高网...
【技术保护点】
1.一种地址检索方法,其特征在于,包括:
2.如权利要求1所述的地址检索方法,其特征在于,
3.如权利要求2所述的地址检索方法,其特征在于,
4.如权利要求3所述的地址检索方法,其特征在于,
5.如权利要求4所述的地址检索方法,其特征在于,
6.如权利要求5所述的地址检索方法,其特征在于,
7.如权利要求6所述的地址检索方法,其特征在于,
8.一种地址检索装置,包括:
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的地址检索方法的步骤。
10.一种计算机设备,包括:
【技术特征摘要】
1.一种地址检索方法,其特征在于,包括:
2.如权利要求1所述的地址检索方法,其特征在于,
3.如权利要求2所述的地址检索方法,其特征在于,
4.如权利要求3所述的地址检索方法,其特征在于,
5.如权利要求4所述的地址检索方法,其特征在于,
6.如权利要求5所述的地址检索方法...
【专利技术属性】
技术研发人员:张栋,赵骥,
申请(专利权)人:深圳依时货拉拉科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。