数据模型的生成方法、调用方法、装置、设备及存储介质制造方法及图纸

技术编号:28460982 阅读:47 留言:0更新日期:2021-05-15 21:25
本申请公开了一种数据模型的生成方法、装置、计算机设备及存储介质,该方法包括:获取多种不同的客户数据;对多种所述客户数据进行数据处理,获得对应的多种样本数据;将多种所述样本数据输入深度神经网络进行训练,获得通用客户数据编码模型;对所述通用客户数据编码模型进行模型后处理;在处理后的所述通用客户数据编码模型上增加分类器,并将相应任务的客户响应数据输入所述通用客户数据编码模型进行模型微调,获得所述相应任务的数据模型,提高了数据建模的效率并降低建模成本。了数据建模的效率并降低建模成本。了数据建模的效率并降低建模成本。

【技术实现步骤摘要】
数据模型的生成方法、调用方法、装置、设备及存储介质


[0001]本申请涉及计算机
,尤其涉及一种数据模型的生成方法、调用方法、装置、设备及存储介质。

技术介绍

[0002]银行对客户进行精细化的运营越来越依赖于现代的数据建模技术,对于不同银行不同数据,不同建模团队会根据以往的个人经验,选择不同建模方法。银行客户数据建模的方法往往需要针对特定的银行的某个特定的任务制定有针对性的建模方案,多个任务制定相应的多个模型,耗用大量的时间。同时,模型容易受到数据不均衡(Data imbalance)、标签数据少等问题的影响,严重影响模型的性能。而且,制作好的模型只能适用在某个特定的任务上,模型的有效期也比较短,有效期过了后又需要针对最近的数据进行重新建模,成本高。
[0003]因此,如何提高数据建模的效率并降低建模成本已成为亟待解决的问题。

技术实现思路

[0004]本申请实施例提供一种数据模型的生成方法、调用方法、装置、设备及存储介质,可以实现提高数据建模的效率并降低建模成本。
[0005]第一方面,本申请实施例提供本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据模型的生成方法,其特征在于,包括:获取多种不同的客户数据;对多种所述客户数据进行数据处理,获得对应的多种样本数据;将多种所述样本数据输入深度神经网络进行训练,获得通用客户数据编码模型;对所述通用客户数据编码模型进行模型后处理;在处理后的所述通用客户数据编码模型上增加分类器,并将相应任务的客户响应数据输入所述通用客户数据编码模型进行模型微调,获得所述相应任务的数据模型。2.根据权利要求1所述的方法,其特征在于,所述对多种所述客户数据进行数据处理,获得对应的多种样本数据之前,包括:调用数据转换器采用对应的数据转换模板,将多种所述客户数据转换为统一的标准存储数据格式;调用标准客户数据存储器将标准存储数据格式的多种所述客户数据按照存储策略进行集中存储;所述对多种所述客户数据进行数据处理包括以下至少一种:数据清洗、数据预处理、数据增广。3.根据权利要求2所述的方法,其特征在于,所述数据增广包括以下至少一种:对所述客户数据中连续变化的字段添加随机噪声;对所述客户数据中相应字段添加字段级随机掩码;对所述客户数据中相应组别的字段添加字段组级随机掩码;将所述客户数据的字段组间的顺序进行随机打乱;采用随机变量对所述客户数据进行随机截断并进行拼接;采用随机变量将不同的所述客户数据进行混合;将添加字段级随机掩码或字段组级随机掩码的所述客户数据输入神经网络,生成数据副本;将同一客户的所述客户数据进行时序打乱后合并;将同一客户的所述客户数据进行时序翻转;将不同客户的所述客户数据进行时序拼接。4.根据权利要求1至3任一项所述的方法,其特征在于,所述客户数据为银行客户数据,多种所述样本数据包括行内客户正样本数据、行内客户负样本数据、行内客户时空正样本数据、行内客户时空负样本数据、跨行客户正样本数据、以及跨行客户负样本数据,所述客户响应数据包括客户标签数据、客户时序标签数据、以及客户空间标签数据。5.根据权利要求4所述的方法,其特征在于,所述行内客户正样本数据是第一锚点与所述第一锚点增广处理后的数据对,其中,所述第一锚点为同一家银行内部某一个时间点的客户数据;所述行内客户负样本数据是所述第一锚点与同一家银行内部同一个时间点不同客户的客户数据对;所述行内客户时空正样本数据是第二锚点与所述第二锚点临近时空的快照数据对,其中,所述第二锚点为同一家银行内部某一个时间段的客户数据;所述行内客户时空负样本数据是所述第二锚点与同一家银行不同客户的客户数据对;
所述跨行客户正样本数据是第三锚点与其他银行内部的同一个客户的客户数据对,其中,所述第三锚点为同一家银行内部某一个时间段的客户数据;所述跨行客户负样本数据是所述第三锚点与其他银行内部的不同客户的客户数据对。6.根据权利要求4所述的方法,其特征在于,所述将多种所述样本数据输入深度神经网络进行训练,获得通用客户数据编码模型,包括:初始化所述深度神经网络的网络参数;将所述行内客户正样本数据以及所述行内客户负样本数据输入所述深度神经网络进行训练,获得所述通用客户数据编码模型;所述对所述通用客户数据编码模型进行模型后处理,包括:将所述通用客户数据编码模型中的投影头丢弃;采用客户标签数据对所述通用客户数据编码模型进行分类任务训练,对所述通用客户数据编码模型进行finetune;对finetune后的所述通用客户数据编码模型进行蒸馏;所述在处理后的所述通用客户数据编码模型上增加分类器,并将相应任务的客户响应数据输入所述...

【专利技术属性】
技术研发人员:龚骏华
申请(专利权)人:深圳索信达数据技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1