变量构造方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:28297294 阅读:25 留言:0更新日期:2021-04-30 16:22
本发明专利技术公开了一种变量构造方法、装置、设备及计算机可读存储介质,本发明专利技术通过将变量的构造分两步进行,增加了衍生变量的构造,使得在每一小于月单位时长的第一单位时长内就可进行一次流水信息收集与基础变量的构造,尤其是在第一单位时长为日级别时长,第二单位时长为月份级别时长时,基础变量库即可仅承担当天数据的计算功能,会将每天的流水信息的计算量降低到原有的1/(30*N),其中N为需要统计的月份数,因此每天可将大批量的流水数据整合为基础变量,再汇总多月的基础变量以构造衍生变量,而由多月的基础变量再构造衍生变量时的数据量往往会大大减小,从而明显提升运算效率,进而解决了现有的基于多月流水信息构造变量的方式效率低下的技术问题。

【技术实现步骤摘要】
变量构造方法、装置、设备及计算机可读存储介质
本专利技术涉及金融科技(Fintech)
,尤其涉及变量构造方法、装置、设备及计算机可读存储介质。
技术介绍
随着计算机技术的发展,越来越多的技术(大数据、分布式、区块链Blockchain、人工智能等)应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要求,也对技术提出了更高的要求。流水信息是互联网渠道常见的信息源类型,开发人员可根据这些流水信息构建变量来进行建模,因此需要每天对流水信息进行加工处理,将其转换为建模过程中可用的变量形式,再通过变量库将每天计算出的变量加以存储。现有的变量库通常是直接从数据库中选取多月的流水信息,再对多月的流水信息进行整体频数信息的统计,最后再将统计得到的频数信息进行加工处理以构建变量,进而建模。但是由于多月的流水信息往往数据量庞大,因此对其进行计算处理构造变量的效率也比较低下。
技术实现思路
本专利技术的主要目的在于提出一种变量构造方法、装置、设备及计算机可读存储介质,旨在解决现有的基于多月流水信息构造变量的方式效率低下的技术问题。为实现上述目的,本专利技术提供一种变量构造方法,所述变量构造方法包括:获取预设的第一单位时长内的流水信息,对所述流水信息进行整合以构造出与所述第一单位时长对应的基础变量,其中,所述第一单位时长小于每月单位时长;汇总预设的第二单位时长内的所有所述基础变量作为基础变量集合,其中,所述第二单位时长大于所述第一单位时长;根据所述基础变量集合构造与所述第二单位时长对应的衍生变量。可选地,所述流水信息包括记录用户行为的基础信息,所述对所述流水信息进行整合以构造出与所述第一单位时长对应的基础变量的步骤包括:获取所述基础信息,并识别所述基础信息的信息类型;按照所述信息类型对所述基础信息进行统计,构造出第一基础变量,以作为所述基础变量。可选地,所述流水信息还包括时段信息,所述按照所述信息类型对所述基础信息进行统计,构造出第一基础变量的步骤之后,还包括:获取所述流水信息中的时段信息,其中,所述时段信息包括日间时段信息、夜间时段信息、工作时段信息和/或非工作时段信息;根据所述时段信息对所述第一基础变量进行时段整合,得到各时段对应的第二基础变量,以将所述第一基础变量与所述第二基础变量作为所述基础变量,并基于所述第二基础变量进行征信建模。可选地,所述第一单位时长包括每日单位时长,所述获取预设的第一单位时长内的流水信息的步骤包括:捕捉用户终端上的用户行为数据,并将所述用户行为数据记录为后台日志信息;每隔一所述每日单位时长获取新增的后台日志信息,以基于所述新增的后台日志信息得到每日的流水信息。可选地,所述对所述流水信息进行整合以构造出与所述第一单位时长对应的基础变量的步骤包括:基于Embedding算法将所述流水信息进行转化,以构造出嵌入变量作为所述基础变量。可选地,所述基于Embedding算法将所述流水信息进行转化,以构造出嵌入变量的步骤包括:利用独热编码方式将所述流水信息转化为编码向量,并对所述编码向量进行降维映射以得到低维向量;基于所述低维向量进行逻辑回归训练,以预测出目标嵌入向量,并根据所述目标嵌入向量得到所述嵌入变量。可选地,所述根据所述基础变量集合构造与所述第二单位时长对应的衍生变量的步骤之后,还包括:监控所述衍生变量在预设监控指标上的指标数值;在检测到所述指标数值符合预设风险条件时,生成并推送所述衍生变量对应的变量迁移风险提示消息。此外,为实现上述目的,本专利技术还提供一种变量构造装置,所述变量构造装置包括:基础变量构造模块,用于获取预设的第一单位时长内的流水信息,对所述流水信息进行整合以构造出与所述第一单位时长对应的基础变量,其中,所述第一单位时长小于每月单位时长;基础变量汇总模块,用于汇总预设的第二单位时长内的所有所述基础变量作为基础变量集合,其中,所述第二单位时长大于所述第一单位时长;衍生变量构造模块,用于根据所述基础变量集合构造与所述第二单位时长对应的衍生变量。可选地,所述流水信息包括记录用户行为的基础信息,所述基础变量构造模块包括:信息类型识别单元,用于获取所述基础信息,并识别所述基础信息的信息类型;第一变量构造单元,用于按照所述信息类型对所述基础信息进行统计,构造出第一基础变量,以作为所述基础变量。可选地,所述流水信息还包括时段信息,所述基础变量构造模块包括:时段信息获取单元,用于获取所述流水信息中的时段信息,其中,所述时段信息包括日间时段信息、夜间时段信息、工作时段信息和/或非工作时段信息;第二变量构造单元,用于根据所述时段信息对所述第一基础变量进行时段整合,得到各时段对应的第二基础变量,以将所述第一基础变量与所述第二基础变量作为所述基础变量,并基于所述第二基础变量进行征信建模。可选地,所述第一单位时长包括每日单位时长,所述基础变量构造模块包括:日志信息记录单元,用于捕捉用户终端上的用户行为数据,并将所述用户行为数据记录为后台日志信息;每日流水获取单元,用于每隔一所述每日单位时长获取新增的后台日志信息,以基于所述新增的后台日志信息得到每日的流水信息。可选地,所述基础变量构造模块还包括:嵌入变量构造单元,用于基于Embedding算法将所述流水信息进行转化,以构造出嵌入变量作为所述基础变量。可选地,所述嵌入变量构造单元还用于:利用独热编码方式将所述流水信息转化为编码向量,并对所述编码向量进行降维映射以得到低维向量;基于所述低维向量进行逻辑回归训练,以预测出目标嵌入向量,并根据所述目标嵌入向量得到所述嵌入变量。可选地,所述变量构造装置还包括:指标数值监控模块,用于监控所述衍生变量在预设监控指标上的指标数值;风险条件检测单元,用于在检测到所述指标数值符合预设风险条件时,生成并推送所述衍生变量对应的变量迁移风险提示消息。此外,为实现上述目的,本专利技术还提供一种变量构造设备,所述变量构造设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的变量构造程序,所述变量构造程序被所述处理器执行时实现如上所述的变量构造方法的步骤。此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有变量构造程序,所述变量构造程序被处理器执行时实现如上所述的变量构造方法的步骤。本专利技术提供一种变量构造方法、装置、设备及计算机可读存储介质。以往无衍生变量的流水信息变量库是每天根据近若干月内的全部流水信息统一进行汇总,然后再对这些大数据量的汇总流水信息进行计算以构造出若干月内的变量,而本专利技术通过将变量的构造分两步进行,增加了衍生变量的构造,使得在每一小于月单位时长的第本文档来自技高网...

【技术保护点】
1.一种变量构造方法,其特征在于,所述变量构造方法包括:/n获取预设的第一单位时长内的流水信息,对所述流水信息进行整合以构造出与所述第一单位时长对应的基础变量,其中,所述第一单位时长小于每月单位时长;/n汇总预设的第二单位时长内的所有所述基础变量作为基础变量集合,其中,所述第二单位时长大于所述第一单位时长;/n根据所述基础变量集合构造与所述第二单位时长对应的衍生变量。/n

【技术特征摘要】
1.一种变量构造方法,其特征在于,所述变量构造方法包括:
获取预设的第一单位时长内的流水信息,对所述流水信息进行整合以构造出与所述第一单位时长对应的基础变量,其中,所述第一单位时长小于每月单位时长;
汇总预设的第二单位时长内的所有所述基础变量作为基础变量集合,其中,所述第二单位时长大于所述第一单位时长;
根据所述基础变量集合构造与所述第二单位时长对应的衍生变量。


2.如权利要求1所述的变量构造方法,其特征在于,所述流水信息包括记录用户行为的基础信息,
所述对所述流水信息进行整合以构造出与所述第一单位时长对应的基础变量的步骤包括:
获取所述基础信息,并识别所述基础信息的信息类型;
按照所述信息类型对所述基础信息进行统计,构造出第一基础变量,以作为所述基础变量。


3.如权利要求2所述的变量构造方法,其特征在于,所述流水信息还包括时段信息,
所述按照所述信息类型对所述基础信息进行统计,构造出第一基础变量的步骤之后,还包括:
获取所述流水信息中的时段信息,其中,所述时段信息包括日间时段信息、夜间时段信息、工作时段信息和/或非工作时段信息;
根据所述时段信息对所述第一基础变量进行时段整合,得到各时段对应的第二基础变量,以将所述第一基础变量与所述第二基础变量作为所述基础变量,并基于所述第二基础变量进行征信建模。


4.如权利要求2所述的变量构造方法,其特征在于,所述第一单位时长包括每日单位时长,
所述获取预设的第一单位时长内的流水信息的步骤包括:
捕捉用户终端上的用户行为数据,并将所述用户行为数据记录为后台日志信息;
每隔一所述每日单位时长获取新增的后台日志信息,以基于所述新增的后台日志信息得到每日的流水信息。


5.如权利要求1所述的变量构造方法,其特征在于,所述对所述流水信息进行整合以构造出与所述第一单位时长对应...

【专利技术属性】
技术研发人员:要卓陈婷吴三平庄伟亮
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1