System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 地址检索方法、装置、计算机设备及计算机可读存储介质制造方法及图纸_技高网

地址检索方法、装置、计算机设备及计算机可读存储介质制造方法及图纸

技术编号:40602438 阅读:4 留言:0更新日期:2024-03-12 22:07
本申请提供了地址检索方法、装置、计算机设备及计算机可读存储介质。所述的地址检索方法,包括:获取待检索地址;对待检索地址进行分词;对分词后的待检索地址进行前缀检索获得召回地址;对召回地址按优质程度排序。本申请实施例的地址检索方法,先对待检索地址进行分词;对分词后的待检索地址进行前缀检索获得召回地址,前缀检索召回是将前缀与待检索地址的前缀词相同的地址召回。由于当用户输入的待检索内容较短时,前缀词往往就是关键词,通过前缀检索获得召回地址,可以容易把握用户的真实意图,能有针对性地检索获得目标地址,检索效率高,准确性高。

【技术实现步骤摘要】

本申请涉及信息,尤其涉及一种地址检索方法、装置、计算机设备及计算机可读存储介质


技术介绍

1、随着移动互联网和信息技术的发展,人们的生活方式发生了大的改变,如电商、物流、出行等,无不与信息技术进行了完美的结合。地址检索的应用程序(app)应运而生。

2、在应用系统检索地址时,用户先在应用程序输入待检索地址。当用户输入的待检索内容较短、无法把握用户真实意图时,现有的地址检索方式无法将目标地址检索出来供用户选择。

3、针对现存方法存在的问题,急需提供一种针对待检索内容较短的地址检索方法、装置、计算机设备及计算机可读存储介质。


技术实现思路

1、本申请的目的在于提供一种针对待检索内容较短的地址检索方法、装置、计算机设备及存储介质,旨在解决上述技术问题之一。

2、第一方面,本申请实施例提供了一种地址检索方法,包括:

3、获取待检索地址;

4、对所述待检索地址进行分词;

5、对分词后的所述待检索地址进行前缀检索获得召回地址;

6、对所述召回地址按优质程度排序。

7、优选地,上述对分词后的待检索地址进行前缀检索获得召回地址的步骤之后还包括:对分词后的所述待检索地址分别按词进行分词检索获得召回地址。

8、优选地,上述获取待检索地址的步骤之后还包括:对所述待检索地址进行整体检索获得召回地址。

9、优选地,上述对所述召回地址按优质程度排序具体为:

10、获取历史待检索地址作为训练数据;设置lightgbm模型;用所述训练数据训练所述lightgbm模型;输入所述召回地址,通过训练后的所述lightgbm模型对所述召回地址进行打分获得评分;按所述评分从高到低对所述召回地址进行排序。

11、优选地,上述用所述训练数据训练所述lightgbm模型的步骤之前还包括:

12、在所述lightgbm模型中根据待检索地址的字符数量设置对应的正负样本比例;在所述lightgbm模型中设置正样本得分高、负样本得分低的评分机制。

13、优选地,在所述lightgbm模型中根据待检索地址的字符数量设置对应的正负样本比例具体为:在所述lightgbm模型中设置所述待检索地址的字符数量多的正负样本比例低、所述待检索地址的字符数量少的正负样本比例高的正负样本比例。

14、优选地,上述在所述lightgbm模型中设置所述待检索地址的字符数量多的正负样本比例低、所述待检索地址的字符数量少的正负样本比例高的正负样本比例具体包括:在所述lightgbm模型中判断所述待检索地址的字符数量,如果所述字符数量小于等于3时,正负样本的比例设置为3:7;如果所述字符数量大于6时,正负样本的比例设置为1:9;如果所述字符数量大于3、且小于等于6时,正负样本的比例设置为2:8;

15、所述对分词后的所述待检索地址进行前缀检索获得召回地址具体为:用分布式搜索和分析引擎的方法对分词后的所述待检索地址进行前缀检索获得召回地址;

16、所述对分词后的所述待检索地址分别按词进行分词检索获得召回地址具体为:用分布式搜索和分析引擎的方法对分词后的所述待检索地址分别按词进行分词检索获得召回地址;

17、所述对所述待检索地址进行整体检索获得召回地址具体为:用分布式搜索和分析引擎的方法对所述待检索地址进行整体检索获得召回地址。

18、第二方面,本申请实施例提供了一种地址检索装置,包括:检索地址模块,用于获取待检索地址;地址分词模块,用于对所述待检索地址进行分词;前缀召回模块,用于对分词后的所述待检索地址进行前缀检索获得召回地址;地址排序模块,用于对所述召回地址按优质程度排序。

19、第三方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的地址检索方法的步骤。

20、第四方面,本申请实施例提供了一种计算机设备,包括:一个或多个处理器;存储器;以及一个或多个计算机程序,所述处理器和所述存储器通过总线连接,其中所述一个或多个计算机程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述处理器执行所述计算机程序时实现如上所述的地址检索方法的步骤。

21、本申请实施例的地址检索方法,先对待检索地址进行分词;对分词后的待检索地址进行前缀检索获得召回地址,前缀检索召回是将前缀与待检索地址的前缀词相同的地址召回。由于当用户输入的待检索内容较短时,前缀词往往就是关键词,通过前缀检索获得召回地址,可以容易把握用户的真实意图,能有针对性地检索获得目标地址,检索效率高,准确性高。

本文档来自技高网...

【技术保护点】

1.一种地址检索方法,其特征在于,包括:

2.如权利要求1所述的地址检索方法,其特征在于,

3.如权利要求2所述的地址检索方法,其特征在于,

4.如权利要求3所述的地址检索方法,其特征在于,

5.如权利要求4所述的地址检索方法,其特征在于,

6.如权利要求5所述的地址检索方法,其特征在于,

7.如权利要求6所述的地址检索方法,其特征在于,

8.一种地址检索装置,包括:

9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的地址检索方法的步骤。

10.一种计算机设备,包括:

【技术特征摘要】

1.一种地址检索方法,其特征在于,包括:

2.如权利要求1所述的地址检索方法,其特征在于,

3.如权利要求2所述的地址检索方法,其特征在于,

4.如权利要求3所述的地址检索方法,其特征在于,

5.如权利要求4所述的地址检索方法,其特征在于,

6.如权利要求5所述的地址检索方法...

【专利技术属性】
技术研发人员:孙迎雪赵骥沈奇李祥歌
申请(专利权)人:深圳依时货拉拉科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1