一种风险识别方法及装置制造方法及图纸

技术编号:14362899 阅读:58 留言:0更新日期:2017-01-09 10:21
本申请涉及计算机网络与信息技术领域,尤其涉及一种风险识别方法及装置,用以解决基于地理位置的稳定性进行风险识别的准确率及可行度较低的问题。本申请实施例提供的风险识别方法包括:服务器根据待识别用户在至少一种地理位置特征下的特征值,以及每种地理位置特征的各个特征值区间分别对应的位置稳定性贡献系数,确定该待识别用户在每种地理位置特征下的位置稳定性贡献系数;根据所述待识别用户在每种地理位置特征下的位置稳定性贡献系数,确定所述待识别用户的位置稳定性指数,所述位置稳定性指数用于衡量所述待识别用户驻留位置的稳定性;基于确定的所述待识别用户的位置稳定性指数,对该待识别用户进行风险识别。

【技术实现步骤摘要】

本申请涉及计算机网络与信息
,尤其涉及一种风险识别方法及装置
技术介绍
用户在使用互联网时,会留下很多地理位置信息,比如收货地址、上网时的互联网地址(InternetProtocol,IP)、无线保真(WirelessFidelity,WiFi)信息,导航的位置信息等。通过分析一定时间段内用户的地理位置信息,可以确定用户地理位置的稳定性。确定地理位置的稳定性对于进行业务风险识别具有重要作用。一般情况下,地理位置稳定性较低的用户相比地理位置稳定性较高的用户,进行风险操作的概率要大,因此,系统在自动进行风险识别时,应该将用户地理位置的稳定性作为进行风险识别的一个重要指标。目前,一般是通过比较用户的历史地理位置信息与当前的地理位置信息是否一致来确定用户地理位置的稳定性。但是,由于用户的地理位置通常不唯一、不固定,所以这种方式在实际实施中准确率较低,进而导致服务器基于地理位置的稳定性进行风险识别的准确率及可行度较低。
技术实现思路
本申请实施例提供一种风险识别方法及装置,用以解决服务器基于地理位置的稳定性进行风险识别的准确率及可行度较低的问题。本申请实施例提供一种风险识别方法,包括:服务器根据待识别用户在至少一种地理位置特征下的特征值,以及每种地理位置特征的各个特征值区间分别对应的位置稳定性贡献系数,确定该待识别用户在每种地理位置特征下的位置稳定性贡献系数;根据所述待识别用户在每种地理位置特征下的位置稳定性贡献系数,确定所述待识别用户的位置稳定性指数,所述位置稳定性指数用于衡量所述待识别用户驻留位置的稳定性;基于确定的所述待识别用户的位置稳定性指数,对该待识别用户进行风险识别。可选地,根据所述待识别用户在每种地理位置特征下的位置稳定性贡献系数,确定所述待识别用户的位置稳定性指数,具体包括:将所述待识别用户在每种地理位置特征下的位置稳定性贡献系数输入机器分类模型,将所述机器分类模型的输出值确定为该待识别用户的位置稳定性指数;所述机器分类模型是预先通过训练得到的分类模型,用于根据用户在不同种地理位置特征下的位置稳定性贡献系数,预测该用户的位置稳定性指数。可选地,所述服务器根据以下步骤训练出所述机器分类模型:所述服务器获取多个样本用户中,每个样本用户在预设的多种地理位置特征下的特征值;所述多个样本用户包括多个安全类型的样本用户和多个风险类型的样本用户;针对每种地理位置特征,根据每个样本用户在该种地理位置特征下的特征值所属的特征值区间,以及该种地理位置特征的每个特征值区间对应的位置稳定性贡献系数,确定每个样本用户在该种地理位置特征下的位置稳定性贡献系数;根据所述多个样本用户中每个样本用户在每种地理位置特征下的位置稳定性贡献系数,以及每个样本用户的样本用户类型,训练出所述机器分类模型;其中,任一样本用户在每种地理位置特征下的位置稳定性贡献系数为所述机器分类模型的输入值,该样本用户的样本用户类型对应的位置稳定性指数为所述机器分类模型的输出值。可选地,针对每种地理位置特征,所述服务器根据以下步骤确定该种地理位置特征的任一特征值区间对应的位置稳定性贡献系数:根据所述多个样本用户中每个样本用户在该种地理位置特征下的特征值,确定具有该任一特征值区间下的特征值的、安全类型的样本用户数目与风险类型的样本用户数目之间的第一比值,以及所述多个样本用户中安全类型的样本用户总数与风险类型的样本用户总数之间的第二比值;根据所述第一比值和第二比值之间的比值,确定所述任一特征值区间对应的位置稳定性贡献系数;或者,根据所述多个样本用户中每个样本用户在该种地理位置特征下的特征值,确定具有该任一特征值区间下的特征值的、安全类型的样本用户数目与所述多个样本用户中安全类型的样本用户总数之间的第三比值,以及,具有该任一特征值区间下的特征值的、风险类型的样本用户数目与所述多个样本用户中风险类型的样本用户总数之间的第四比值;根据所述第三比值和第四比值之间的比值,确定所述任一特征值区间对应的位置稳定性贡献系数。可选地,所述服务器根据以下公式确定所述任一特征值区间对应的位置稳定性贡献系数WOE:WOE=ln(P1/P0);其中,P1表示所述第一比值,P0表示所述第二比值;或者,P1表示所述第三比值,P0表示所述第四比值。可选地,所述服务器根据以下步骤确定任一种地理位置特征的各个特征值区间:将该种地理位置特征下的每个特征值作为一个特征值区间;确定当前每一对相邻的特征值区间的卡方值,将确定的最小的卡方值所对应的一对相邻的特征值区间进行合并;重复该步骤,直到该种地理位置特征下的特征值区间数目达到预设区间数目;其中,所述卡方值用于表征针对一对相邻的特征值区间,具有其中一个特征值区间下的特征值的、不同类型的样本用户数目占比,与具有另一个特征值区间下的特征值的、不同类型的样本用户数目占比之间的差异。可选地,所述服务器训练机器分类模型之前,还包括:根据不同种地理位置特征之间的相关系数,以及每种地理位置特征的各个特征值区间分别对应的位置稳定性贡献系数,从所述预设的多种地理位置特征中筛选出用于训练机器分类模型的地理位置特征。可选地,根据不同种地理位置特征之间的相关系数,以及每种地理位置特征的各个特征值区间分别对应的位置稳定性贡献系数,从所述预设的多种地理位置特征中筛选出用于训练机器分类模型的地理位置特征,包括:根据不同种地理位置特征之间的相关系数,确定相关系数大于设定阈值的各对地理位置特征;针对每一对相关系数大于设定阈值的地理位置特征,根据该对地理位置特征中,每种地理位置特征的各个特征值区间分别对应的位置稳定性贡献系数,从该对地理位置特征中筛选出一种地理位置特征用于作为训练机器分类模型的地理位置特征。针对每一对相关系数大于设定阈值的地理位置特征,根据该对地理位置特征中,每种地理位置特征的各个特征值区间分别对应的位置稳定性贡献系数,从该对地理位置特征中筛选出一种地理位置特征,包括:根据确定每种地理位置特征的贡献值IV;其中,针对任一种地理位置特征,P1k表示具有第k个特征值区间中的特征值的安全类型的样本用户数目,占获取的所述多个样本用户中安全类型的样本用户总数目的比率,P0k表示具有第k个特征值区间中的特征值的风险类型的样本用户数目,占获取的所述多个样本用户中风险类型的样本用户总数目的比率,WOE(k)表示第k个特征值区间对应的位置稳定性贡献系数,q为该种地理位置特征的特征值区间数目;针对该对地理位置特征中的每种地理位置特征,确定使贡献值IV最小的一种地理位置特征,将IV最小的一种地理位置特征确定为从该对地理位置特征中筛选出的一种地理位置特征。本申请实施例提供一种风险识别装置,包括:第一确定模块,用于根据待识别用户在至少一种地理位置特征下的特征值,以及每种地理位置特征的各个特征值区间分别对应的位置稳定性贡献系数,确定该待识别用户在每种地理位置特征下的位置稳定性贡献系数;第二确定模块,用于根据所述待识别用户在每种地理位置特征下的位置稳定性贡献系数,确定所述待识别用户的位置稳定性指数,所述位置稳定性指数用于衡量所述待识别用户驻留位置的稳定性;识别模块,用于基于第二确定模块确定的所述待识别用户的位置稳定性指数,对该待识别用本文档来自技高网...
一种风险识别方法及装置

【技术保护点】
一种风险识别方法,其特征在于,该方法包括:服务器根据待识别用户在至少一种地理位置特征下的特征值,以及每种地理位置特征的各个特征值区间分别对应的位置稳定性贡献系数,确定该待识别用户在每种地理位置特征下的位置稳定性贡献系数;根据所述待识别用户在每种地理位置特征下的位置稳定性贡献系数,确定所述待识别用户的位置稳定性指数,所述位置稳定性指数用于衡量所述待识别用户驻留位置的稳定性;基于确定的所述待识别用户的位置稳定性指数,对该待识别用户进行风险识别。

【技术特征摘要】
1.一种风险识别方法,其特征在于,该方法包括:服务器根据待识别用户在至少一种地理位置特征下的特征值,以及每种地理位置特征的各个特征值区间分别对应的位置稳定性贡献系数,确定该待识别用户在每种地理位置特征下的位置稳定性贡献系数;根据所述待识别用户在每种地理位置特征下的位置稳定性贡献系数,确定所述待识别用户的位置稳定性指数,所述位置稳定性指数用于衡量所述待识别用户驻留位置的稳定性;基于确定的所述待识别用户的位置稳定性指数,对该待识别用户进行风险识别。2.如权利要求1所述的方法,其特征在于,服务器根据所述待识别用户在每种地理位置特征下的位置稳定性贡献系数,确定所述待识别用户的位置稳定性指数,包括:将所述待识别用户在每种地理位置特征下的位置稳定性贡献系数输入机器分类模型,将所述机器分类模型的输出值确定为该待识别用户的位置稳定性指数;所述机器分类模型是预先通过训练得到的分类模型,用于根据用户在不同种地理位置特征下的位置稳定性贡献系数,预测该用户的位置稳定性指数。3.如权利要求2所述的方法,其特征在于,所述服务器根据以下步骤训练出所述机器分类模型:所述服务器获取多个样本用户中,每个样本用户在预设的多种地理位置特征下的特征值;所述多个样本用户包括多个安全类型的样本用户和多个风险类型的样本用户;针对每种地理位置特征,根据每个样本用户在该种地理位置特征下的特征值所属的特征值区间,以及该种地理位置特征的每个特征值区间对应的位置稳定性贡献系数,确定每个样本用户在该种地理位置特征下的位置稳定性贡献系数;根据所述多个样本用户中每个样本用户在每种地理位置特征下的位置稳定性贡献系数,以及每个样本用户的样本用户类型,训练出所述机器分类模型;其中,任一样本用户在每种地理位置特征下的位置稳定性贡献系数为所述机器分类模型的输入值,该样本用户的样本用户类型对应的位置稳定性指数为所述机器分类模型的输出值。4.如权利要求3所述的方法,其特征在于,针对每种地理位置特征,所述服务器根据以下步骤确定该种地理位置特征的任一特征值区间对应的位置稳定性贡献系数:根据所述多个样本用户中每个样本用户在该种地理位置特征下的特征值,确定具有该任一特征值区间下的特征值的、安全类型的样本用户数目与风险类型的样本用户数目之间的第一比值,以及所述多个样本用户中安全类型的样本用户总数与风险类型的样本用户总数之间的第二比值;根据所述第一比值和第二比值之间的比值,确定所述任一特征值区间对应的位置稳定性贡献系数;或者,根据所述多个样本用户中每个样本用户在该种地理位置特征下的特征值,确定具有该任一特征值区间下的特征值的、安全类型的样本用户数目与所述多个样本用户中安全类型的样本用户总数之间的第三比值,以及,具有该任一特征值区间下的特征值的、风险类型的样本用户数目与所述多个样本用户中风险类型的样本用户总数之间的第四比值;根据所述第三比值和第四比值之间的比值,确定所述任一特征值区间对应的位置稳定性贡献系数。5.如权利要求4所述的方法,其特征在于,所述服务器根据以下公式确定所述任一特征值区间对应的位置稳定性贡献系数WOE:WOE=ln(P1/P0);其中,P1表示所述第一比值,P0表示所述第二比值;或者,P1表示所述第三比值,P0表示所述第四比值。6.如权利要求3~5任一所述的方法,其特征在于,所述服务器根据以下
\t步骤确定任一种地理位置特征的各个特征值区间:将该种地理位置特征下的每个特征值作为一个特征值区间;确定当前每一对相邻的特征值区间的卡方值,将确定的最小的卡方值所对应的一对相邻的特征值区间进行合并;重复该步骤,直到该种地理位置特征下的特征值区间数目达到预设区间数目;其中,所述卡方值用于表征针对一对相邻的特征值区间,具有其中一个特征值区间下的特征值的、不同类型的样本用户数目占比,与具有另一个特征值区间下的特征值的、不同类型的样本用户数目占比之间的差异。7.如权利要求3所述的方法,其特征在于,所述服务器训练所述机器分类模型之前,还包括:根据不同种地理位置特征之间的相关系数,以及每种地理位置特征的各个特征值区间分别对应的位置稳定性贡献系数,从所述预设的多种地理位置特征中筛选出用于训练所述机器分类模型的地理位置特征。8.如权利要求7所述的方法,其特征在于,根据不同种地理位置特征之间的相关系数,以及每种地理位置特征的各个特征值区间分别对应的位置稳定性贡献系数,从所述预设的多种地理位置特征中筛选出用于训练所述机器分类模型的地理位置特征,包括:根据不同种地理位置特征之间的相关系数,确定相关系数大于设定阈值的各对地理位置特征;针对每一对相关系数大于设定阈值的地理位置特征,根据该对地理位置特征中,每种地理位置特征的各个特征值区间分别对应的位置稳定性贡献系数,从该对地理位置特征中筛选出一种地理位置特征用于作为训练所述机器分类模型的地理位置特征。9.如权利要求8所述的方法,其特征在于,针对每一对相关系数大于设定阈值的地理位置特征,根据该对地理位置特征中,每种地理位置特征的各个特征值区间分别对应的位置稳定性贡献系数,从该对地理位置特征中筛选出一
\t种地理位置特征,包括:根据确定每种地理位置特征的贡献值IV;其中,针对任一种地理位置特征,P1k表示具有第k个特征值区间中的特征值的安全类型的样本用户数目,占获取的所述多个样本用户中安全类型的样本用户总数目的比率,P0k表示具有第k个特征值区间中的特征值的风险类型的样本用户数目,占获取的所述多个样本用户中风险类型的样本用户总数目的比率,WOE(k)表示第k个特征值区间对应的位置稳定性贡献系数,q为该种地理位置特征的特征值区间数目;针对该对地理位置特征中的每...

【专利技术属性】
技术研发人员:彭际群何慧梅王峰伟吴东杏何帝君
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1