小样本算法模型的训练方法和电子设备技术

技术编号：40739967 阅读：4 留言：0更新日期：2024-03-25 20:00

本申请提出一种小样本算法模型的训练方法和电子设备，属于数据处理技术领域。该方法对历史行为数据进行处理得到支撑数据集，对各个用户在目标时间段的行为数据进行处理得到查询数据集。再以查询数据集中的任意一个时间子序列为参考中心，对支撑数据集中的各个时间子序列进行聚类，可有效去除历史行为数据中的冗余信息，消除冗余信息对事件提取的影响。再基于去除了冗余信息的聚类特征集构建得到训练集，来对小样本算法模型进行训练，能够提高模型检测的准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及数据处理，尤其涉及一种小样本算法模型的训练方法和电子设备。

技术介绍

1、在金融领域内，关注的主要为风险事件及关键性事件，该类事件在整体数据集中总量少，无法收集与提供大量的事件标注，属于深度学习中的小样本学习。

2、随着数据量的增加和时间区间内样本的增多，通过模型进行事件提取将受大量冗余信息的影响，从而会引起事件提取的准确率大幅降低，导致模型检测的结果不够准确。

技术实现思路

1、本申请实施例的主要目的在于提出一种小样本算法模型的训练方法和电子设备。旨在通过以查询数据集中的任意一个时间子序列为参考中心，对支撑数据集中的各个时间子序列进行聚类，能够去除数据集中的冗余信息，从而可消除冗余信息对事件提取的影响，提高模型检测的准确性。

2、为实现上述目的，本申请实施例的第一方面提出了一种小样本算法模型的训练方法，所述方法包括：

3、获取各个用户的历史行为数据和各个用户在目标时间段的行为数据，其中，所述历史行为数据包括金融产品的历史购买意向行为数据；

4、对所述历史行为数据进行处理得到支撑数据集，和对各个用户在目标时间段的行为数据进行处理得到查询数据集，其中，所述支撑数据集和所述查询数据集均包含多个时间子序列；

5、以所述查询数据集中的任意一个时间子序列为参考中心，对所述支撑数据集中的各个时间子序列进行聚类，并计算得到各所述参考中心对应的聚类特征集；

6、根据所述支撑数据集和所述查询数据集，计算得到所述查询数据

7、利用各所述参考中心对应的聚类特征集构建得到训练集，并构建与所述训练集对应的标签数据集；

8、将所述训练集、标签数据集、所述查询数据集和所述聚类向量输入小样本算法模型中进行多轮迭代训练，获取训练好的目标小样本算法模型。

9、在本申请的一个实施例中，对所述历史行为数据进行处理得到支撑数据集包括：

10、按照滑动窗口对所述历史行为数据进行切片，得到多个时间序列数据；

11、对各个所述时间序列数据进行特征提取，得到各个所述时间序列数据对应的特征向量；

12、对各个所述时间序列数据对应的所述特征向量进行编码处理，得到各个时间子序列；

13、集合各个所述时间子序列，得到支撑数据集。

14、在本申请的一个实施例中，在按照滑动窗口对所述历史行为数据进行切片，得到多个时间序列数据之后，所述方法还包括：

15、对各个所述时间序列数据对应的标签进行标注后存储。

16、在本申请的一个实施例中，所述以所述查询数据集中的任意一个时间子序列为参考中心，对所述支撑数据集中的各个时间子序列进行聚类，并计算得到各所述参考中心对应的聚类特征集，包括：

17、利用余弦相似度计算所述支撑数据集和所述查询数据集之间的相似度；

18、对所述相似度进行归一化变换处理之后与所述支撑数据集相乘，得到各所述参考中心对应的聚类特征集。

19、在本申请的一个实施例中，所述以所述查询数据集中的任意一个时间子序列为参考中心，对所述支撑数据集中的各个时间子序列进行聚类，并计算得到各所述参考中心对应的聚类特征集，包括：

20、将所述支撑数据集和所述查询数据集输入transformer模型进行处理；

21、将键向量对应的权重矩阵与所述支撑数据集相乘后进行转置得到第一结果；

22、将查询向量对应的权重矩阵与所述查询数据集相乘得到第二结果；

23、将所述第一结果与所述第二结果相乘后进行归一化变换处理，再与值向量对应的权重矩阵和所述支撑数据集的乘积相乘，得到第三结果；

24、将所述第三结果输入前向编码器进行编码处理，得到各所述参考中心对应的聚类特征集。

25、在本申请的一个实施例中，根据所述支撑数据集和所述查询数据集，计算得到所述查询数据集对应的交叉注意力，包括：

26、利用余弦相似度计算所述支撑数据集和所述查询数据集之间的相似度；

27、对所述相似度进行映射处理，得到所述查询数据集对应的交叉注意力。

28、在本申请的一个实施例中，根据所述支撑数据集和所述查询数据集，计算得到所述查询数据集对应的交叉注意力，包括：

29、利用余弦相似度计算所述查询数据集和所述聚类特征集之间的相似度；

30、对所述相似度进行归一化变换处理，得到所述查询数据集对应的交叉注意力。

31、在本申请的一个实施例中，根据所述交叉注意力，计算得到聚类向量包括：

32、对所述交叉注意力进行归一化变换处理后加上1的和再与所述查询数据集点乘，得到聚类向量。

33、在本申请的一个实施例中，所述将所述训练集、标签数据集、所述查询数据集和所述聚类向量输入小样本算法模型中进行多轮迭代训练，获取训练好的目标小样本算法模型，包括：

34、基于所述训练集对所述小样本算法模型进行分类学习后，利用所述小样本算法模型对所述查询数据集进行预测生成预测标签；

35、通过所述查询数据集的标签和所述预测标签进行损失函数的损失计算，以对所述小样本算法模型的分类参数进行更新；

36、当所述损失函数收敛或训练次数达到预设迭代次数，停止训练，并获取训练好的目标小样本算法模型。

37、为实现上述目的，本申请实施例的第二方面提出了一种电子设备，所述电子设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现本申请任一实施例所述的方法。

38、在本申请实施例提供的技术方案中，对历史行为数据进行处理得到支撑数据集，对各个用户在目标时间段的行为数据进行处理得到查询数据集。再以查询数据集中的任意一个时间子序列为参考中心，对支撑数据集中的各个时间子序列进行聚类，可有效去除历史行为数据中的冗余信息，消除冗余信息对事件提取的影响。再基于去除了冗余信息的聚类特征集构建得到训练集，来对小样本算法模型进行训练，能够提高模型检测的准确率。

本文档来自技高网...

【技术保护点】

1.一种小样本算法模型的训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，对所述历史行为数据进行处理得到支撑数据集包括：

3.根据权利要求2所述的方法，其特征在于，在按照滑动窗口对所述历史行为数据进行切片，得到多个时间序列数据之后，所述方法还包括：

4.根据权利要求1所述的方法，其特征在于，所述以所述查询数据集中的任意一个时间子序列为参考中心，对所述支撑数据集中的各个时间子序列进行聚类，并计算得到各所述参考中心对应的聚类特征集，包括：

5.根据权利要求1所述的方法，其特征在于，所述以所述查询数据集中的任意一个时间子序列为参考中心，对所述支撑数据集中的各个时间子序列进行聚类，并计算得到各所述参考中心对应的聚类特征集，包括：

6.根据权利要求1所述的方法，其特征在于，根据所述支撑数据集和所述查询数据集，计算得到所述查询数据集对应的交叉注意力，包括：

7.根据权利要求1所述的方法，其特征在于，根据所述支撑数据集和所述查询数据集，计算得到所述查询数据集对应的交叉注意力，包括：

>8.根据权利要求1所述的方法，其特征在于，根据所述交叉注意力，计算得到聚类向量包括：

9.根据权利要求1所述的方法，其特征在于，所述将所述训练集、标签数据集、所述查询数据集和所述聚类向量输入小样本算法模型中进行多轮迭代训练，获取训练好的目标小样本算法模型，包括：

10.一种电子设备，其特征在于，所述电子设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现权利要求1至9任一项所述的方法。

...

【技术特征摘要】

1.一种小样本算法模型的训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，对所述历史行为数据进行处理得到支撑数据集包括：

3.根据权利要求2所述的方法，其特征在于，在按照滑动窗口对所述历史行为数据进行切片，得到多个时间序列数据之后，所述方法还包括：

6...

【专利技术属性】
技术研发人员：叶雄，
申请(专利权)人：深圳前海微众银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人