本发明专利技术公开了一种地址检验的方法和装置,涉及计算机技术领域
【技术实现步骤摘要】
一种地址检验的方法和装置
[0001]本专利技术涉及计算机
,尤其涉及一种地址检验的方法和装置
。
技术介绍
[0002]地址检验技术,即检测一条地址文本是否是有效地址
。
目前,地址检验技术可以用于用户刷单监控
、
地址作弊监控,在物流
、
运营商以及信用卡场景下可以用于地址质量监控,减少无效派送等,从而降低企业的运营成本
。
[0003]现有技术中,通常采用偏复杂的预测模型,或者将地址检验转化为异常检测问题
。
偏复杂的预测模型会影响地址的检验速度,难以支撑线上服务
。
而将地址检验转化为异常检测问题,通常找出异常地址的比率偏低,从而降低地址检验的准确率
。
技术实现思路
[0004]有鉴于此,本专利技术实施例提供一种地址检验的方法和装置,从待验证的地址文本中拆分出详细地址文本和行政信息,并判断行政信息的级联关系和详细地址文本的检验结果,根据二者共同的检验结果确定待检验地址的检验结果
。
由此,将复杂长地址转变为简单的详细地址以作为模型输入,减轻了模型运算的负担,从而保证了处理速度
。
并且通过级联关系的判断,保证了验证结果的准确性
。
[0005]为实现上述目的,根据本专利技术实施例的第一方面,提供了一种地址检验的方法
。
[0006]本专利技术实施例的地址检验的方法包括:
[0007]获取待检验地址;从所述待检验地址中确定出一个或多个行政地址关键词
、
所述一个或多个行政地址关键词分别对应的行政信息
、
以及详细地址文本;分别确定各个所述行政信息的级联关系;根据地址验证模型确定所述详细地址文本的检验结果;根据所述级联关系和
/
或所述详细地址文本的检验结果,确定所述待检验地址的检验结果
。
[0008]可选地,所述根据所述级联关系和
/
或所述详细地址文本的检验结果,确定所述待检验地址的检验结果,包括:
[0009]在所述级联关系不正确的情况下,确定所述待检验地址的检验结果为假地址;
[0010]和
/
或,在所述级联关系正确的情况下,将所述详细地址文本作为所述地址验证模型的输入,根据所述地址验证模型的输出确定所述待检验地址的检验结果
。
[0011]可选地,所述分别确定各个所述行政信息的级联关系,包括:确定所述行政信息的数量是否大于或等于预设数量阈值;
[0012]如果是,判断所述行政信息的级联关系是否满足预设的行政从属关系,在满足所述从属关系的情况下,确定所述级联关系正确;在不满足所述从属关系的情况下,确定所述级联关系不正确;
[0013]如果否,确定所述级联关系不正确
。
[0014]可选地,在确定出所述行政信息的数量大于或等于预设数量阈值之后,在所述判断所述行政信息的级联关系是否满足预设的行政从属关系之前,进一步包括:判断多个所
述行政信息中是否存在重复的行政信息;
[0015]若是,则删除重复的行政信息,并重复执行判断所述行政信息的数量是否大于或等于预设数量阈值的步骤;
[0016]否则,判断所述行政信息的级联关系是否满足所述行政从属关系
。
[0017]可选地,在所述待检验地址中包括多个相同的行政地址关键词的情况下,针对所述多个相同的行政地址关键词分别对应的目标行政信息:根据所述待检验地址中与所述多个相同的行政地址关键词行政级别相邻的其他关键词,确定所述目标行政信息的级联关系;分别确定每一个所述目标行政信息的级联关系是否满足所述行政从属关系
。
[0018]可选地,所述根据地址验证模型确定所述详细地址文本的检验结果,包括:以所述详细地址作为所述地址验证模型的输入,输出置信度;判断所述置信度是否满足概率阈值;若是,则确定所述详细地址文本的检验结果为真地址;否则,确定所述详细地址文本的检验结果为假地址
。
[0019]可选地,所述地址验证模型为
fasttext
模型,所述
fasttext
模型中的损失函数为
focalloss
损失函数
。
[0020]为实现上述目的,根据本专利技术实施例的第二方面,提供了一种地址检验的装置
。
[0021]本专利技术实施例的地址检验的装置包括:
[0022]获取模块,用于获取待检验地址;
[0023]识别模块,用于从所述待检验地址中确定出一个或多个行政地址关键词
、
所述一个或多个行政地址关键词分别对应的行政信息
、
以及详细地址文本;
[0024]检验模块,用于分别确定各个所述行政信息的级联关系;根据地址验证模型确定所述详细地址文本的检验结果;根据所述级联关系和
/
或所述详细地址文本的检验结果,确定所述待检验地址的检验结果
。
[0025]可选地,所述检验模块还用于,在所述级联关系不正确的情况下,确定所述待检验地址的检验结果为假地址
。
[0026]可选地,所述检验模块还用于,在所述级联关系正确的情况下,将所述详细地址文本作为所述地址验证模型的输入,根据所述地址验证模型的输出确定所述待检验地址的检验结果
。
[0027]可选地,所述检验模块还用于,确定所述行政信息的数量是否大于或等于预设数量阈值;如果是,判断所述行政信息的级联关系是否满足预设的行政从属关系,在满足所述从属关系的情况下,确定所述级联关系正确;在不满足所述从属关系的情况下,确定所述级联关系不正确;如果否,确定所述级联关系不正确
。
[0028]可选地,所述检验模块还用于,在确定出所述行政信息的数量大于或等于预设数量阈值之后,在所述判断所述行政信息的级联关系是否满足预设的行政从属关系之前,判断多个所述行政信息中是否存在重复的行政信息;若是,则删除重复的行政信息,并重复执行判断所述行政信息的数量是否大于或等于预设数量阈值的步骤;否则,判断所述行政信息的级联关系是否满足所述行政从属关系
。
[0029]可选地,所述检验模块还用于,在所述待检验地址中包括多个相同的行政地址关键词的情况下,针对所述多个相同的行政地址关键词分别对应的目标行政信息:根据所述待检验地址中与所述多个相同的行政地址关键词行政级别相邻的其他关键词,确定所述目
标行政信息的级联关系;分别确定每一个所述目标行政信息的级联关系是否满足所述行政从属关系
。
[0030]可选地,所述检验模块还用于,以所述详细地址作为所述地址验证模型的输入,输出置信度;判断所述置信度是否满足概率阈值;若是,则确定所述详细地址文本的检验结果为真地址;否则,确定所述详细地址文本的检验结果为假地址
。
[0031]可选地,所述本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.
一种地址检验的方法,其特征在于,所述方法包括:获取待检验地址;从所述待检验地址中确定出一个或多个行政地址关键词
、
所述一个或多个行政地址关键词分别对应的行政信息
、
以及详细地址文本;分别确定各个所述行政信息的级联关系;根据地址验证模型确定所述详细地址文本的检验结果;根据所述级联关系和
/
或所述详细地址文本的检验结果,确定所述待检验地址的检验结果
。2.
根据权利要求1所述的方法,其特征在于,所述根据所述级联关系和
/
或所述详细地址文本的检验结果,确定所述待检验地址的检验结果,包括:在所述级联关系不正确的情况下,确定所述待检验地址的检验结果为假地址;和
/
或,在所述级联关系正确的情况下,将所述详细地址文本作为所述地址验证模型的输入,根据所述地址验证模型的输出确定所述待检验地址的检验结果
。3.
根据权利要求2所述的方法,其特征在于,所述分别确定各个所述行政信息的级联关系,包括:确定所述行政信息的数量是否大于或等于预设数量阈值;如果是,判断所述行政信息的级联关系是否满足预设的行政从属关系,在满足所述从属关系的情况下,确定所述级联关系正确;在不满足所述从属关系的情况下,确定所述级联关系不正确;如果否,确定所述级联关系不正确
。4.
根据权利要求3所述的方法,其特征在于,在确定出所述行政信息的数量大于或等于预设数量阈值之后,在所述判断所述行政信息的级联关系是否满足预设的行政从属关系之前,进一步包括:判断多个所述行政信息中是否存在重复的行政信息;若是,则删除重复的行政信息,并重复执行判断所述行政信息的数量是否大于或等于预设数量阈值的步骤;否则,判断所述行政信息的级联关系是否满足所述行政从属关系
。5.
根据权利要求3所述的方法,其特征在于,在所述待检验地址中包括多个相同的行...
【专利技术属性】
技术研发人员:潘明瑞,
申请(专利权)人:北京京东叁佰陆拾度电子商务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。