【技术实现步骤摘要】
一种虚假地址信息识别的方法及装置
本申请涉及信息
,尤其涉及一种虚假地址信息识别的方法及装置。
技术介绍
随着信息技术的发展,通过网络执行的业务越来越多,通常可对用户提供的地址信息的真实性进行核实,来保证执行业务时的安全性。如,对的账户的基本信息进行核实,若可判明该账户的地址信息是虚假的,则该账户存在较高风险,在执行业务时需要谨慎对待。在现有技术中,通常采用通过搜索引擎核实以及物流信息核实的方式,对地址信息进行核实。具体的,通过搜索引擎进行地址信息的核实,就是将该待核实的地址信息输入现有的搜索引擎中进行搜索,通过该搜索引擎已经收录的地址信息,确定该待核实的地址信息是否真实存在。通过物流信息进行地址信息的核实,则是通过已经收录的物流信息中已有的地址信息,对该待核实的地址信息的真实性进行核实。但是,通过搜索引擎进行地址信息的核实时,核实结果的准确率以及覆盖率,均基于选择的搜索引擎已经收录的地址信息的数量而决定,即,当选用的搜索引擎收录的地址信息多且覆盖地域广的话,核实结果的准确率和覆盖率可能较高,而 ...
【技术保护点】
1.一种虚假地址信息识别的方法,所述方法包括:/n确定账户的待核实地址信息;/n根据所述账户的各地理位置信息以及训练完成的分类模型,确定所述账户的常驻范围;/n将所述待核实地址信息与所述常驻范围进行匹配;/n根据所述待核实地址信息与所述常驻范围的匹配结果,确定所述待核实地址信息是否是虚假地址信息。/n
【技术特征摘要】
1.一种虚假地址信息识别的方法,所述方法包括:
确定账户的待核实地址信息;
根据所述账户的各地理位置信息以及训练完成的分类模型,确定所述账户的常驻范围;
将所述待核实地址信息与所述常驻范围进行匹配;
根据所述待核实地址信息与所述常驻范围的匹配结果,确定所述待核实地址信息是否是虚假地址信息。
2.如权利要求1所述的方法,所述地理位置信息包括:经度、纬度。
3.如权利要求2所述的方法,所述地理位置信息还包括:定位精度;
根据所述账户的各地理位置信息以及训练完成的分类模型,确定所述账户的常驻范围,具体包括:
根据预设的定位精度阈值,从所述账户在预设时间段内上报的各地理位置信息中,确定定位精度不小于所述预设的定位精度阈值的地理位置信息;
根据定位精度不小于所述预设的定位精度阈值的地理位置信息,以及训练完成的分类模型,确定所述账户的常驻范围。
4.如权利要求1所述的方法,还包括:
根据预设的网格大小,将地图划分为若干网格;
将所述地图上的各网格,作为预先划分的地理范围。
5.如权利要求4所述的方法,所述确定所述账户的常驻范围,具体包括:
在所述预先划分的地理范围中,确定所述账户的常驻范围。
6.如权利要求5所述的方法,采用下述方法训练所述分类模型:
确定若干已知真实地址信息的账户,作为训练样本;
针对每个训练样本,根据该训练样本上报的若干地理位置信息,确定该训练样本出现在各网格中的次数;
根据该训练样本在各网格中出现的次数,确定该训练样本在各网格中对应的特征值;
根据各训练样本在各网格中对应的特征值,以及各训练样本已知真实地址信息,训练所述分类模型。
7.如权利要求5所述的方法,确定所述账户的常驻范围,具体包括:
根据所述账户在预设时间段内上报的各地理位置信息,确定所述账户在各网格中对应的特征值;
将所述账户在各网格中对应的特征值输入所述训练完成的分类模型中,确定所述账户的常驻范围。
8.如权利要求1所述的方法,根据所述待核实地址信息与所述常驻范围的匹配结果,确定所述待核实地址信息是否是虚假地址信息,具体包括:
根据所述待核实地址信息对应的经度以及纬度,确定所述待核实地址信息的坐标;
判断所述待核实地址信息的坐标是否落入所述常驻范围内;
若是,则确定所述待核实地址信息不是虚假地址信息;
若否,则确定所述待核实地址信息是虚假地址信息。
9.如权利要求1所述的方法,所述待核实地址信息包括:待核实居住地址信息以及待核实工作地址信息;
确定所述账户常驻范围,具体包括:
确定所述账户的常驻居住范围以及常驻工作范围。
10.如权利要求9所述的方法,训练所述分类模型,具体包括:
确定已知真实居住地址信息以及已知真实工作地址信息的若干账户,作为训练样本;
针对每个训练样本,根据该训练样本上报的若干地理位置信息,确定该训练样本出现在每个网格中的次数以及时间;
根据该训练样本在每个网格中出现的次数和时间,确定该训练样本在各网格中对应的特征值;
根据各训练样本在各网格中对应的特征值、各训练样本已知真实居住地址信息以及各训练样本已知真实工作地址信息,训练所述分类模型,所述分类模型用于确定常驻居住范围以及常驻工作范围。
11.如权利要求10所述的方法,该训练样本在任一网格中对应的特征值包括:该训练样本在该网格内出现次数占总出现次数的比例、该训练样本在该网格内出现天数占总出现天数的比例、该训练样本在该网格内工作日出现天数占总出现天数的比例、该训练样本在该网格内节假日出现天数占总出现天数的比例、该训练样本在该网格内工作日白天出现天数占总出现天数的比例、该训练样本在该网格内工作日夜间出现天数占总出现天数的比例、该训练样本在该网格内节假日白天出现天数占总出现天数的比例、该训练样本在该网格内节假日夜间出现天数占总出现天数的比例中的至少一种。
12.如权利要求9所述的方法,根据所述待核实地址信息与所述常驻范围的匹配结果,确定所述待核实地址信息是否是虚假地址信息,具体包括:
当所述待核实地址信息为待核实居住地址信息时,根据所述待核实居住地址信息对应的经度以及纬度,确定所述待核实居住地址信息的坐标;判断所述待核实居住地址信息的坐标是否落入所述常驻居住范围内;若是,则确定所述待核实地址信息不是虚假地址信息;若否,则确定所述待核实地址信息是虚假地址信息;
当所述待核实地址信息为待核实工作地址信息时,根据所述待核实工作地址信息对应的经度以及纬度,确定所述待核实工作地址信息的坐标;判断所...
【专利技术属性】
技术研发人员:蒋贤礼,
申请(专利权)人:创新先进技术有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。