一种在线事务数据处理模型发布的方法和装置制造方法及图纸

技术编号:14782030 阅读:68 留言:0更新日期:2017-03-10 00:59
本申请公开了一种在线事务数据处理模型发布的方法和装置以及一种在线事务数据处理方法和装置。根据在线待处理事务数据的相关参数将在线待处理事务数据聚类,并将聚类后的在线待处理事务数据按照设定的算法分流到新建事务数据处理模型和现有事务数据处理模型进行处理后,根据上述两种模型对在线待处理事物数据处理结果的性能评价指标计算新建事务数据处理模型和现有事务数据处理模型的性能差异。

【技术实现步骤摘要】

本申请涉及一种在线事务数据处理模型发布的方法和装置。本申请还涉及一种在线事务数据处理的方法和装置。
技术介绍
国际互联网的网上在线事务数据处理系统,需要保障事务数据的安全,在线事务数据处理系统的事务数据处理模型用于评估判断在线事务数据的安全性,其性能会随时间的推移越来越退化,一段时间以前建立的现有的事务数据处理模型不能符合最新的真实在线事务数据情况,为此需要开发新建事务数据处理模型来替换现有的模型,而新建的模型是基于实验数据建模的。通常,新建事务数据处理模型的建立是根据已经发生过的真实的在线事务数据的相关数据,把需要识别出来的在事务数据的行为特征在新建事务数据处理模型中用参数或变量的形式体现出来,即新建事务数据处理模型是基于离线训练方式建立的。而新建事务数据处理模型的建模是一个耗时比较长的项目,一般一个新建事务数据处理模型的建立到正式上线运用最快需要1个月的时间,因为模型建立的周期长、因此在新建事务数据处理模型所基于的真实事务数据以后的事务数据的内的需要识别出来的事务数据的行为特征不会被包括在新建事务数据处理模型中,从而导致模型的训练结果与真实事务数据环境的识别结果有着很大的差异。申请内容本申请提供一种在线事务数据处理模型发布的方法,能够利用在线的真实事务数据环境训练新建的事务数据处理模型,以解决解决现有事务数据处理模型离线训练方式的训练结果与最新建真实在线事务数据环境的识别结果有着很大的差异的问题。相应地,本申请还提供一种在线事务数据处理模型实时发布装置。此外本申请还提供一种在线事务数据处理的方法和一种在线事务数据处理的装置。本申请提供的一种在线事务数据处理模型发布的方法,包括以下步骤:获取在线待处理事务数据的相关参数;根据在线待处理事务数据的相关参数将在线待处理事务数据分类;将聚类后的在线待处理事务数据按照设定的算法分流到新建事务数据处理模型或现有事务数据处理模型;根据上述两种模型对在线待处理事物数据处理结果的性能评价指标计算新建事务数据处理模型和现有事务数据处理模型的性能差异。可选地,所述在线待处理事务数据的相关参数包括:在线待处理事务数据的序号,在线待处理事务金额,在线待处理事务发起者登录的地点,在线待处理事务发生的时间或实时待处理事务发起者账户一天内进行在线事务的次数。可选地,所述根据在线待处理事务数据的相关参数将在线待处理事务数据聚类的方法包括:根据在线待处理事务数据的相关参数随机均匀地将在线待处理事务数据聚类。可选地,所述根据在线待处理事务数据的相关参数随机均匀地将在线待处理事务数据聚类的方法包括:以设定的值为除数对在线待处理事务数据的序号进行求余数的操作,余数相同的在线待处理事务数据归为同一类。可选地,所述将聚类后的在线待处理事务数据按照设定的算法分流到新建事务数据处理模型或现有事务数据处理模型的方法包括:设定在线待处理事务数据分流的比例;根据设定的在线待处理事务数据分流的比例将不同类别的在线待处理事务数据分别分流到新建事务数据处理模型和现有事务数据处理模型进行处理。可选地,所述根据在线待处理事务数据的相关参数将在线待处理事务数据聚类的方法包括:根据在线待处理事务数据的相关参数,将满足设定的条件的在线待处理事务数据归为高风险类在线待处理事务数据,将不满足设定的条件的在线待处理事务数据归为低风险类在线待处理事务数据;相应地,所述将聚类后的在线待处理事务数据按照设定的算法分流到新建事务数据处理模型和现有事务数据处理模型进行处理的方法包括:使高风险类在线待处理事务数据同时进入新建事务数据处理模型和现有事务数据处理模型进行处理。可选地,所述设定的条件包括:在线待处理事务金额超出设定的阈值,在线待处理事务发起者登录的地点属于预先设定的范围,在线待处理事务发生的时间属于预先设定的范围或在线待处理事务发起者账户一天内进行在线事务的次数超出设定的阈值。可选地,所述根据上述两种模型对在线待处理事物数据处理结果的性能评价指标计算新建事务数据处理模型和现有事务数据处理模型的性能差异的步骤包括:分别绘制新建、现有事务数据处理模型的查准率-查全率曲线;根据所述新建、现有事务数据处理模型的查准率-查全率曲线,比较得出新建事务数据处理模型和现有事务数据处理模型的性能差异。可选地,所述分别绘制新建、现有事务数据处理模型的查准率-查全率曲线的方法包括:调整在线待处理事务数据分流的比例;按照不同在线待处理事务数据分流的比例使在线待处理事务数据分别进入新建、现有事务数据处理模型;分别计算不同在线待处理事务数据分流比例情况下新建、现有事务数据处理模型的查准率和查全率;分别以查全率和查准率作为平面直角坐标系的坐标轴建立一个平面直角坐标系,将在线待处理事务数据不同分流比例下新建事务数据处理模型相对应的查全率和查准率数据对作为所述平面直角坐标系内的不同的坐标点;将在线待处理事务数据不同分流比例下现有事务数据处理模型相对应的查全率和查准率数据对作为所述平面直角坐标系内的不同的坐标点;将所述平面直角坐标系内新建事务数据处理模型和现有事务数据处理模型的坐标点分别连成线得到新建事务数据处理模型的查准率-查全率曲线和现有事务数据处理模型的查准率-查全率曲线。可选地,所述查准率为:事务数据处理模型评估识别正确的在线待处理事务数据数量与该事务数据处理模型所评估的在线待处理事务数据总量的比值;所述查全率为:事务数据处理模型评估正确的在线待处理事务数据数量与该事务数据处理模型评估的交易中实际需要评估识别出的在线待处理事务数据数量的比值。可选地,所述根据所述新建、现有事务数据处理模型的查准率-查全率曲线,比较得出新建事务数据处理模型和现有事务数据处理模型的性能差异的方法为:在所述平面直角坐标系内,根据新建、现有事务数据处理模型的查准率-查全率曲线距离点(1,1)的距离远近,得出对新建事务数据处理模型和现有事务数据处理模型的性能差异。本申请提供的一种在线事务数据处理方法,包括如下步骤:获取在线待处理事务数据的相关参数;根据在线待处理事务数据的相关参数将在线待处理事务数据聚类;将聚类后的在线待处理事务数据按照设定的算法分流到新建事务数据处理模型和现有事务数据处理模型进行处理。可选地,所述在线待处理事务数据的相关参数包括:在线待处理事务数据的序号,在线待处理事务金额,在线待处理事务发起者登录的地点,在线待处理事务发生的时间或实时待处理事务发起者账户一天内进行在线事务的次数。可选地,所述根据在线待处理事务数据的相关参数将在线待处理事务数据聚类的方法包括:根据在线待处理事务数据的相关参数随机均匀地将在线待处理事务数据聚类。可选地,所述根据在线待处理事务数据的相关参数随机均匀地将在线待处理事务数据聚类的方法包括:以设定的值为除数对在线待处理事务数据的序号进行求余数的操作,余数相同的在线待处理事务数据归为同一类。可选地,所述将聚类后的在线待处理事务数据按照设定的算法分流到新建事务数据处理模型和现有事务数据处理模型进行处理的方法包括:设定在线待处理事务数据分流的比例;根据设定的在线待处理事务数据分流的比例将不同类别的在线待处理事务数据分别分流到新建事务数据处理模型和现有事务数据处理模型进行处理。可选本文档来自技高网...
一种在线事务数据处理模型发布的方法和装置

【技术保护点】
一种在线事务数据处理模型发布的方法,其特征在于,包括以下步骤:获取在线待处理事务数据的相关参数;根据在线待处理事务数据的相关参数,将在线待处理事务数据聚类;将聚类后的在线待处理事务数据按照设定的算法分流到新建事务数据处理模型和现有事务数据处理模型进行处理;根据上述两种模型对在线待处理事物数据处理结果的性能评价指标计算新建事务数据处理模型和现有事务数据处理模型的性能差异。

【技术特征摘要】
1.一种在线事务数据处理模型发布的方法,其特征在于,包括以下步骤:获取在线待处理事务数据的相关参数;根据在线待处理事务数据的相关参数,将在线待处理事务数据聚类;将聚类后的在线待处理事务数据按照设定的算法分流到新建事务数据处理模型和现有事务数据处理模型进行处理;根据上述两种模型对在线待处理事物数据处理结果的性能评价指标计算新建事务数据处理模型和现有事务数据处理模型的性能差异。2.根据权利要求1所述的在线事务数据处理模型发布的方法,其特征在于,所述在线待处理事务数据的相关参数包括以下所列中的至少一种:在线待处理事务数据的序号,在线待处理事务金额,在线待处理事务发起者登录的地点,在线待处理事务发生的时间或在线待处理事务发起者账户一天内进行在线事务的次数。3.根据权利要求1所述的在线事务数据处理模型发布的方法,其特征在于,所述根据在线待处理事务数据的相关参数将在线待处理事务数据聚类的方法包括:根据在线待处理事务数据的相关参数随机均匀地将在线待处理事务数据聚类。4.根据权利要求3所述的在线事务数据处理模型发布的方法,其特征在于,所述根据在线待处理事务数据的相关参数随机均匀地将在线待处理事务数据聚类的方法包括:以设定的值为除数对在线待处理事务数据的序号进行求余数的操作,余数相同的在线待处理事务数据归为同一类。5.根据权利要求1所述的在线事务数据处理模型发布的方法,其特征在于,所述将聚类后的在线待处理事务数据按照设定的算法分流到新建事务数据处理模型和现有事务数据处理模型进行处理的方法包括:设定在线待处理事务数据分流的比例;根据设定的在线待处理事务数据分流的比例将不同类别的在线待处理事务数据分别分流到新建事务数据处理模型和现有事务数据处理模型进行处理。6.根据权利要求1所述的在线事务数据处理模型发布的方法,其特征在于,
\t所述根据在线待处理事务数据的相关参数将在线待处理事务数据聚类的方法包括:根据在线待处理事务数据的相关参数,将满足设定的条件的在线待处理事务数据归为高风险类在线待处理事务数据,将不满足设定的条件的在线待处理事务数据归为低风险类在线待处理事务数据;相应地,所述将聚类后的在线待处理事务数据按照设定的算法分流到新建事务数据处理模型和现有事务数据处理模型进行处理的方法包括:使高风险类在线待处理事务数据同时进入新建事务数据处理模型和现有事务数据处理模型进行处理。7.根据权利要求6所述的在线事务数据处理模型发布的方法,其特征在于,所述设定的条件包括:在线待处理事务金额超出设定的阈值,在线待处理事务发起者登录的地点属于预先设定的范围,在线待处理事务发生的时间属于预先设定的范围或在线待处理事务发起者账户一天内进行在线事务的次数超出设定的阈值。8.根据权利要求1所述的在线事务数据处理模型发布的方法,其特征在于,所述根据上述两种模型对在线待处理事物数据处理结果的性能评价指标计算新建事务数据处理模型和现有事务数据处理模型的性能差异的步骤包括:分别绘制新建、现有事务数据处理模型的查准率-查全率曲线;根据所述新建、现有事务数据处理模型的查准率-查全率曲线,比较得出新建事务数据处理模型和现有事务数据处理模型的性能差异。9.根据权利要求8所述的在线事务数据处理模型发布的方法,其特征在于,所述分别绘制新建、现有事务数据处理模型的查准率-查全率曲线的方法包括:调整在线待处理事务数据分流的比例;按照不同在线待处理事务数据分流的比例使在线待处理事务数据分别进入新建、现有事务数据处理模型;分别计算不同在线待处理事务数据分流比例情况下新建、现有事务数据处理模型的查准率和查全率;分别以查全率和查准率作为平面直角坐标系的坐标轴建立一个平面直角坐标系,将在线待处理事务数据不同分流比例下新建事务数据处理模型相对应的
\t查全率和查准率数据对作为所述平面直角坐标系内的不同的坐标点;将在线待处理事务数据不同分流比例下现有事务数据处理模型相对应的查全率和查准率数据对作为所述平面直角坐标系内的不同的坐标点;将所述平面直角坐标系内新建事务数据处理模型和现有事务数据处理模型的坐标点分别连成线得到新建事务数据处理模型的查准率-查全率曲线和现有事务数据处理模型的查准率-查全率曲线。10.根据权利要求8所述的在线事务数据处理模型发布的方法,其特征在于,所述查准率为:事务数据处理模型评估识别正确的在线待处理事务数据数量与该事务数据处理模型所评估的在线待处理事务数据总量的比值;所述查全率为:事务数据处理模型评估正确的在线待处理事务数据数量与该事务数据处理模型评估的交易中实际需要评估识别出的在线待处理事务数据数量的比值。11.根据权利要求9所述的在线事务数据处理模型发布的方法,其特征在于,所述根据所述新建、现有事务数据处理模型的查准率-查全率曲线,比较得出新建事务数据处理模型和现有事务数据处理模型的性能差异的方法为:在所述平面直角坐标系内,根据新建、现有事务数据处理模型的查准率-查全率曲线距离点(1,1)的距离远近,得出对新建事务数据处理模型和现有事务数据处理模型的性能差异。12.一种在线事务数据处理方法,其特征在于,包括如下步骤:获取在线待处理事务数据的相关参数;根据在线待处理事务数据的相关参数将在线待处理事务数据聚类;将聚类后的在线待处理事务数据按照设定的算法分流到新建事务数据处理模型和现有事务数据处理模型进行处理。13.根据权利要求12所述的在线事务数据处理方法,其特征在于,所述在线待处理事务数据的相关参数包括:在线待处理事务数据的序号,在线待处理事务金额,在线待处理事务发起者登录的地点,在线待处理事务发生的时间或在线待处理事务发起者账户一天内进行在线事务的次数。14.根据权利要求12所述的在线事务数据处理方法,其特征在于,所述根据在线待处理事务数据的相关参数将在线待处理事务数据聚类的方法包括:根据在线待处理事务数据的相关参数随机均匀地将在线待处理事务数据聚类。15...

【专利技术属性】
技术研发人员:梅健
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1