数据流的控制策略中阈值的调整方法、装置和设备制造方法及图纸

技术编号:20118923 阅读:47 留言:0更新日期:2019-01-16 12:16
本申请实施例公开了一种数据流的控制策略中阈值的调整方法、装置和设备,该方法包括:获取当前时刻的控制策略和当前时刻之前预定时间段内的数据流分布,该数据流包括被识别分为第一类数据流和第二类数据流;确定预定时间段内的数据流到达第一逻辑模块的第一基本逻辑表达式的逻辑判决时的第一数据流;根据第一数据流在第一属性参数中按照不同阈值划分后的基尼指数,选择最优基尼指数,其中,第一属性参数为第一基本逻辑表达式中的属性参数,该基尼指数用于评估第一数据流在第一属性参数中按照阈值划分后第一类数据流和第二类数据流的分流效果;确定该最优基尼指数对应的阈值为第一属性参数对应的调整后阈值。

Threshold Adjustment Method, Device and Equipment in Data Flow Control Strategy

The embodiment of this application discloses a method, apparatus and apparatus for adjusting threshold in a data flow control strategy, which includes acquiring the control strategy at the current time and the data flow distribution in a predetermined time period before the current time. The data flow includes the data flow identified as the first type of data flow and the second type of data flow; and determining the arrival of the data flow in a predetermined time period to the first logical module. The first data stream in the logical decision of the first basic logical expression; according to the Gini index of the first data stream divided by different thresholds in the first attribute parameter, the optimal Gini index is selected, in which the first attribute parameter is the attribute parameter of the first basic logical expression, and the Gini index is used to evaluate the first data stream divided according to the threshold in the first attribute parameter. Secondly, the diversion effect of the first type data stream and the second type data stream is determined, and the threshold corresponding to the optimal Gini index is determined to be the adjusted threshold corresponding to the first attribute parameter.

【技术实现步骤摘要】
数据流的控制策略中阈值的调整方法、装置和设备
本申请涉及计算机软件
,尤其涉及一种数据流的控制策略中阈值的调整方法、装置和设备。
技术介绍
在互联网金融风险控制领域,风险策略无疑扮演着举足轻重的角色,控制策略更是由于其简洁有效的特征而被广泛使用。随着时间的推移,金融服务请求的数据特征分布也会发生变化,为了维护风险控制系统的性能稳定,相应的风控策略参数也应随金融服务请求的数据流而变化。例如,服务请求中的客户端IP地址这个数据特征,可包括政府部门的IP地址,高科技公司的IP地址,私人住宅的IP地址,或者是属于公共区域的网吧的IP地址。显然,这几类IP地址中所蕴含的安全风险是不一样的。但是,由于IP地址可能随着时间而变更,例如42.120.75.5现在属于支付宝,当支付宝办公地址迁移至新的办公大楼后,这个IP地址也有可能属于一个公共网吧。公共网吧的安全风险和支付宝的安全风险显然不一样。这就需要当依据IP地址对金融服务请求进行安全风险评估时所需要的估计参数随时间而变更。当然,除了IP地址外,数据流中还可能包括其它影响安全风险评估的属性。如何调整数据流对应的策略参数以适应数据流的分布变化本文档来自技高网...

【技术保护点】
1.一种数据流的控制策略中阈值的调整方法,包括:获取当前时刻的控制策略和当前时刻之前预定时间段内的数据流分布,所述数据流包括被识别分为第一类数据流和第二类数据流,所述控制策略包括由逻辑与连接的多个逻辑模块,每个逻辑模块包括一个基本逻辑表达式或由逻辑或连接的多个基本逻辑表达式,每个基本逻辑表达式包括所述数据流的一种属性参数与所述属性参数对应的阈值的比较逻辑,所述控制策略用于控制所述数据流的分流;确定预定时间段内的数据流到达第一逻辑模块的第一基本逻辑表达式的逻辑判决时的第一数据流,第一逻辑模块为所述多个逻辑模块的任一个逻辑模块,第一基本逻辑表达式为第一逻辑模块中的任一个基本逻辑表达式;根据第一数据...

【技术特征摘要】
1.一种数据流的控制策略中阈值的调整方法,包括:获取当前时刻的控制策略和当前时刻之前预定时间段内的数据流分布,所述数据流包括被识别分为第一类数据流和第二类数据流,所述控制策略包括由逻辑与连接的多个逻辑模块,每个逻辑模块包括一个基本逻辑表达式或由逻辑或连接的多个基本逻辑表达式,每个基本逻辑表达式包括所述数据流的一种属性参数与所述属性参数对应的阈值的比较逻辑,所述控制策略用于控制所述数据流的分流;确定预定时间段内的数据流到达第一逻辑模块的第一基本逻辑表达式的逻辑判决时的第一数据流,第一逻辑模块为所述多个逻辑模块的任一个逻辑模块,第一基本逻辑表达式为第一逻辑模块中的任一个基本逻辑表达式;根据第一数据流在第一属性参数中按照不同阈值划分后的基尼指数,选择最优基尼指数,其中,第一属性参数为第一基本逻辑表达式中的属性参数,所述基尼指数用于评估第一数据流在第一属性参数中按照阈值划分后第一类数据流和第二类数据流的分流效果;确定所述最优基尼指数对应的阈值为第一属性参数对应的调整后阈值。2.如权利要求1所述的方法,根据第一数据流在第一属性参数中按照不同阈值划分后的基尼指数,选择最优基尼指数,包括:确定第一属性参数的阈值的第一最大值和第一最小值,并根据第一最大值、第一最小值和阈值量化分段数确定第一步长值;计算从第一最小值起的阈值以及每次累加第一步长值后的阈值中各阈值对应的第一基尼指数,直至阈值超过第一最大值,并选择最优的第一基尼指数及对应的第一阈值;确定第一阈值+第一步长值/2为第二最大值,确定第一阈值-第一步长值/2为第二最小值,并根据第二最大值、第二最小值和阈值量化分段数确定第二步长值;计算从第二最小值起的阈值以及每次累加第一步长值后的阈值中各阈值对应的第二基尼指数,直至阈值超过第二最大值,并选择最优的第二基尼指数及对应的第二阈值;如果最优的第一基尼指数与最优的第二基尼指数之差的绝对值小于或等于预定阈值,则确定最优的第二基尼指数为所述最优基尼指数。3.如权利要求2所述的方法,根据第一数据流在第一属性参数中按照不同阈值划分后的基尼指数,选择最优基尼指数,还包括:如果最优的第一基尼指数与最优的第二基尼指数之差大于预定阈值,则以第二阈值作为第一阈值,以第二阈值+第二步长值/2作为第二最大值,以第二阈值-第一步长值/2作为第二最小值,并重新根据第二最大值、第二最小值、阈值量化分段数确定第二步长值,以求取第二最大值和第二最小值调整后的最优第二基尼指数,直至最优的第一基尼指数与最优的第二基尼指数之差的绝对值小于或等于预定阈值;确定最优的第二基尼指数为所述最优基尼指数。4.如权利要求1所述的方法,根据第一数据流在第一属性参数中按照不同阈值划分后的基尼指数,选择最优基尼指数,包括:确定第一属性参数的阈值的最大值、第一属性参数的阈值的最小值和循环次数P,并根据最大值、最小值和阈值量化分段数确定步长值;对p从1至P循环执行以下步骤:计算从最小值起的阈值以及每次累加步长值后的阈值中各阈值对应的第三基尼指数,直至阈值超过最大值,并选择最优的第三基尼指数及对应的第三阈值;在p≠P时确定第三阈值+步长值/2为第一属性参数的阈值的最大值,确定第三阈值-步长值/2为第一属性参数的阈值的最小值,并根据调整后的最大值、调整后的最小值和阈值量化分段数重新确定步长值;确定第三基尼指数为最优基尼指数。5.如权利要求1-4中任一项所述的方法,第一数据流在第一属性参数中按照阈值划分后的基尼指数,通过如下公式确定:Gini(f)=|D1|/|D|Gini_D1(f)+|D2|/|D|Gini_D2(f);其中,f表示第一属性参数对应的阈值,Gini(f)表示阈值f对应的基尼指数,D表示第一数据流,D1表示第一数据流在第一属性参数上经过所述阈值f划分后的第一集合,D2表示第一数据流在第一属性参数上经过所述阈值f划分后的第二集合,绝对值符号||表示集合中数据流的条数,Gini_D1(f)表示第一集合的基尼指数,Gini_D2(f)表示第二集合的基尼指数。6.如权利要求5所述的方法,Gini_D1(f)和Gini_D2(f)分别用以下公式表示:Gini_D1(f)=1-p02-p12;Gini_D2(f)=1-p22-p32;其中,p0表示第一类数据流在第一集合中的概率,p1表示第二类数据流在第一集合中的概率,p2表示第一类数据流在第二集合中的概率,p3表示第二类数据流在第二集合中的概率。7.如权利要求1所述的方法,确定预定时间段内的数据流到达第一逻辑模块的第一基本逻辑表达式的逻辑判决时的第一数据流,包括:确定预定时间段内的数据流到达第一逻辑模块的第二数据流,其中,当所述第一逻辑模块为所述多个逻辑模块中数据流到达的第一个进行逻辑判决的逻辑模块时,所述第二数据流为所述预定时间段内的数据流,当所述第一逻辑模块为所述多个逻辑模块中数据流到达的第N个进行逻辑判决的逻辑模块时,所述第二数据流为第N-1个进行逻辑判决的逻辑模块中各基本逻辑表达式的逻辑判决为是的数据流,N为大于1的正整数,N不大于所述控制策略包含的逻辑模块的个数;确定第二数据流到达第一基本逻辑表达式的逻辑判决时的第一数据流,其中,当所述第一基本逻辑表达式为第二数据流在第一逻辑模块到达的第一...

【专利技术属性】
技术研发人员:刘震章鹏阮怀玉杨志雄张英
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1