模型训练方法、异常数据检测方法、装置和电子设备制造方法及图纸

技术编号：24939616 阅读：26 留言：0更新日期：2020-07-17 21:17

本说明书实施例公开了模型训练方法、异常数据检测方法、装置和电子设备的实施例。所述方法包括：获取训练样本集，所述训练样本集包括无标签样本集和有标签样本集，所述无标签样本集包括多个第一样本，所述有标签样本集包括多个第二样本和类型标签；根据所述无标签样本集，对第一模型进行训练，所述第一模型包括特征提取子模型；根据所述有标签样本集和所述特征提取子模型的训练结果，对第二模型进行训练，所述第二模型包括所述特征提取子模型和异常数据检测子模型，所述异常数据检测子模型用于根据所述特征提取子模型的输出检测异常数据。本说明书实施例可以提高第二模型的训练效果。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、异常数据检测方法、装置和电子设备
本说明书实施例涉及计算机
，特别涉及一种模型训练方法、异常数据检测方法、装置和电子设备。
技术介绍
在实际应用中，经常需要检测业务数据是否为异常数据。为此可以训练模型，进而可以通过训练的模型检测业务数据是否为异常数据。如何提高模型的训练效果是当前亟需解决的技术问题。
技术实现思路
本说明书实施例提供一种模型训练方法、异常数据检测方法、装置和电子设备，以提高模型的训练效果。本说明书实施例的技术方案如下。本说明书实施例的第一方面，提供了一种模型训练方法，包括：获取训练样本集，所述训练样本集包括无标签样本集和有标签样本集，所述无标签样本集包括多个第一样本，所述有标签样本集包括多个第二样本和类型标签，所述类型标签用于表示所述有标签样本集中是否包含异常的第二样本；根据所述无标签样本集，对第一模型进行训练，所述第一模型包括特征提取子模型；根据所述有标签样本集和所述特征提取子模型的训练结果，对第二模型进行训练，所述第二模型包括所述特征提取子模型和异常数据检测子模型，所述异常数据检测子模型用于根据所述特征提取子模型的输出检测异常数据。本说明书实施例的第二方面，提供了一种异常数据检测方法，包括：将业务数据集输入至使用如第一方面所述方法训练后的第二模型，得到所述业务数据集的检测结果，所述业务数据集包括多个业务数据。本说明书实施例的第三方面，提供了一种模型训练装置，包括：获取单元，用于获取训练样本集，所述样本集包括无标签样本集和有标签...

【技术保护点】
1.一种模型训练方法，包括：/n获取训练样本集，所述训练样本集包括无标签样本集和有标签样本集，所述无标签样本集包括多个第一样本，所述有标签样本集包括多个第二样本和类型标签，所述类型标签用于表示所述有标签样本集中是否包含异常的第二样本；/n根据所述无标签样本集，对第一模型进行训练，所述第一模型包括特征提取子模型；/n根据所述有标签样本集和所述特征提取子模型的训练结果，对第二模型进行训练，所述第二模型包括所述特征提取子模型和异常数据检测子模型，所述异常数据检测子模型用于根据所述特征提取子模型的输出检测异常数据。/n

【技术特征摘要】
1.一种模型训练方法，包括：
获取训练样本集，所述训练样本集包括无标签样本集和有标签样本集，所述无标签样本集包括多个第一样本，所述有标签样本集包括多个第二样本和类型标签，所述类型标签用于表示所述有标签样本集中是否包含异常的第二样本；
根据所述无标签样本集，对第一模型进行训练，所述第一模型包括特征提取子模型；
根据所述有标签样本集和所述特征提取子模型的训练结果，对第二模型进行训练，所述第二模型包括所述特征提取子模型和异常数据检测子模型，所述异常数据检测子模型用于根据所述特征提取子模型的输出检测异常数据。

2.如权利要求1所述的方法，所述第一模型还包括数据关系检测子模型，所述数据关系检测子模型用于根据所述特征提取子模型的输出检测两个无标签样本集是否对应同一业务对象；所述对第一模型进行训练，包括：
将至少两个无标签样本集输入至特征提取子模型，得到至少两个第一特征数据；
将至少两个第一特征数据输入至数据关系检测子模型，得到至少一个数据关系检测结果；
根据数据关系检测结果，确定所述第一模型的模型参数。

3.如权利要求2所述的方法，所述特征提取子模型包括编码模块和注意力模块；所述将至少两个无标签样本集输入至所述特征提取子模型，包括：
将至少两个无标签样本集输入至编码模块，得到至少两个第一编码数据集；
将至少两个第一编码数据集输入至注意力模块，得到至少两个第一特征数据。

4.如权利要求3所述的方法，所述编码模块包括全连接层和自注意力层；所述将至少两个无标签样本集输入至编码模块，得到至少两个第一编码数据集，包括：
将至少两个无标签样本集输入至全连接层，以分别对所述至少两个无标签样本集进行降维处理，得到至少两个降维处理结果集；
将至少两个降维处理结果集输入至自注意力层，以分别对所述至少两个降维处理结果集执行基于注意力机制的运算，得到至少两个第一编码数据集。

5.如权利要求3所述的方法，所述第一模型还包括数据预测子模型，所述数据预测子模型用于根据所述特征提取子模型的输出进行数据预测；所述方法还包括：
将无标签样本集中的至少一个第一样本替换为特定样本；
将替换后的无标签样本集输入至编码模块，得到第二编码数据集；
将第二编码数据集中与所述特定样本相对应的编码数据输入至数据预测子模型，得到与所述特定样本相对应的预测结果；...

【专利技术属性】
技术研发人员：顾喆旭，齐翔，吴新琪，周荣旺，楼景华，周斌，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人