一种生成式营销事件风控规则库的构建方法及系统技术方案

技术编号:39642436 阅读:9 留言:0更新日期:2023-12-09 11:09
本发明专利技术公开了一种生成式营销事件风控规则库的构建方法及系统,属于无监督风险识别领域

【技术实现步骤摘要】
一种生成式营销事件风控规则库的构建方法及系统


[0001]本专利技术涉及深度学习的异常检测领域,具体地说是一种基于无监督学习的生成式营销事件风控规则库的构建方法及系统


技术介绍

[0002]由于异常事件的发生频率较低并且通常缺乏清晰的定义,以及往往缺乏真实的标签,目前对无监督异常检测方法的研究相对较少

此外,在营销事件中,同样存在缺乏真实标签的情况,这会对检测异常风险事件增加很大的难度

[0003]随着现代智能产业中传感器数量不断增加,对营销事件的异常检测越来越困难

如何有效地处理多传感器的测量结果以学习环境的动态和背景,并提高系统的运行效率成为新的挑战

传统的数学学习方法在处理大规模数据源时存在局限性,因此引入深度学习
(DL)
成为一种有吸引力的选择
。DL
能够有效地解释上下文感知的潜在模式,并被广泛认为是各个领域中最先进的方法之一

在基于
DL
的表征学习中,已经有一些研究致力于设计错误行为检测方法,以检测多传感器数据中的异常事件

然而,这些方法通常不能从多传感器数据中提取出一个强大且统一的基本正常行为表示,并同时保留事件之间的依赖性

因此,需要进一步探索和开发创新的方法,以克服这些挑战,提高对多传感器数据中风险事件的准确检测和有效建模的能力


技术实现思路

[0004]本专利技术的目的在于解决现有技术在无监督异常检测方面存在的问题,提出一种基于无监督学习的生成式营销事件风控规则库的构建方法及系统,其通过负向学习和无监督学习的结合,以此有效应对缺乏真实标签和多传感器数据的挑战,为构建风险规则库和营销事件的风险控制提供支持

[0005]为此,本专利技术采用如下的技术方案:一种生成式营销事件风控规则库的构建方法,其包括:步骤1),数据准备,收集和准备用于训练和测试的营销风险事件样本数据集;步骤2),构建生成器,生成器接受一个营销风险事件样本数据作为输入,并根据营销风险事件样本生成营销风险事件重构样本;步骤3),构建判别器,用于区分真实的营销风险事件样本和生成器生成的营销风险事件重构样本;步骤4),定义损失函数,通过最小化生成器和判别器的损失函数,利用生成器生成逼真的重构样本,并使判别器具有更好的辨别能力;步骤5),通过负向学习
(NL)
反馈,训练无监督生成协同学习模型
(GCL)
,所述的无监督生成协同学习模型包括一个所述的生成器和一个所述的判别器;在训练过程中,交替训练生成器和判别器,首先,固定生成器,通过最小化判别器的损失来更新判别器的参数;然后,固定判别器,通过最小化生成器的损失来更新生成器的参数;通过负向学习反馈机制
提高生成器的性能,直到生成器和判别器都达到收敛状态;步骤6),风险事件识别,使用已训练好的无监督生成协同学习模型进行风险事件的识别;步骤7),写入风险规则库,将判断为异常风险事件的数据写入风险规则库中,实时更新风险规则库

[0006]本专利技术提出了一种新的无监督生成协同学习
(GCL)
异常检测方法,通过利用异常事件的低频率特征以及交叉监督的方式,使用生成器和判别器相互学习,来实现对营销风险事件的异常检测和判别;同时,采用多传感器数据的统一学习网络
(USMD)
作为判别器,该判别器利用自动编码器架构

基于
LSTM
的时间依赖网络
(TDN)
和注意力单元以及隔离森林算法,对生成器生成的重构样本和真实样本进行判别,然后计算生成器的损失函数值(
loss
值),将
loss
值和给定的阈值进行比较,判断样本是否是异常的,如果是异常的事件,把该事件写入风险规则库中

[0007]本专利技术特别适用于识别风险事件的场景,能够在复杂的监测场景中定位异常事件,而不需要标记的训练数据,实现新型营销事件风险虚拟生成与识别,丰富风控规则库

[0008]进一步地,步骤2)中,所述的生成器为一个自动编码器(
AE
),自动编码器由编码器和解码器组成,编码器将输入数据映射到潜在空间中的低维表示,而解码器则将潜在空间中的低维表示映射回原始数据空间

[0009]更进一步地,步骤2)中,所述生成器的训练过程如下:1)输入真实的营销风险事件样本数据;2)编码器将真实的营销风险事件样本数据转换为潜在表示向量;3)解码器将潜在表示向量解码为风险事件重构样本;4)计算重构样本与真实样本之间的差异,即重构损失;5)使用反向传播算法更新生成器的参数,以最小化重构损失,使重构样本更接近真实样本

[0010]进一步地,步骤3)中,所述的判别器采用一种用于系统异常检测的模型,称为统一学习网络,在异常行为检测中,判别器使用隔离森林算法作为异常检测方法;判别器接受一个样本作为输入,并输出一个标量值,表示输入样本是真实样本还是重构样本

[0011]更进一步地,步骤3)中,所述的隔离森林算法是一种基于树的无监督异常检测算法,用于快速识别重构样本中的异常点;所述隔离森林算法的具体步骤如下:1)构建隔离树:每棵隔离树通过随机选择特征和分割值构建;先从输入特征集中随机选择一个特征;然后从选定特征的取值范围内随机选择一个分割值;再将数据集中小于等于分割值的样本放入左子集,大于分割值的样本放入右子集;最后对左

右子集分别进行递归操作,继续选择特征和分割值,直到满足停止条件;2)构建隔离森林:重复步骤
1)
,构建多棵隔离树,形成隔离森林;3)计算样本的异常得分:对于每个样本,在隔离森林中通过树的路径长度计算其异常得分,路径长度表示从根节点到达终端节点所经过的边数;4)设定阈值并识别异常点:根据异常得分和预先设定的阈值,将样本划分为正常点和异常点

[0012]更进一步地,所述统一学习网络,具体包括:
统一学习网络是利用长短期记忆和注意力单元的结合,对输入的数据进行统一的表示,然后利用隔离森林算法作为一个错误检测器,进行判别

[0013]进一步地,步骤4)中, 生成器的损失函数是重构损失函数,重构损失函数是在自动编码器中使用的一种目标函数,重构损失函数使用均方差损失计算;判别器的损失函数使用二元交叉熵损失函数衡量其分类性能

[0014]进一步地,步骤5)中,所述负向学习,具体描述如下:负向学习是判别器对生成器的一种反馈机制,在训练生成器时,生成器被鼓励对具有异常伪标签的样本进行标签翻转重建,对具有正常伪标签的样本旨在以最小误差进行正常的重建;把判断为异常的原向量替换为全为1的向量,正常的则使用原向量

[0015]进一步地,步骤6)中,所述风险事件识别,具体本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种生成式营销事件风控规则库的构建方法,其特征在于,包括:步骤1),数据准备,收集和准备用于训练和测试的营销风险事件样本数据集;步骤2),构建生成器,生成器接受一个营销风险事件样本数据作为输入,并根据营销风险事件样本生成营销风险事件重构样本;步骤3),构建判别器,用于区分真实的营销风险事件样本和生成器生成的营销风险事件重构样本;步骤4),定义损失函数,通过最小化生成器和判别器的损失函数,利用生成器生成逼真的重构样本,并使判别器具有更好的辨别能力;步骤5),通过负向学习反馈,训练无监督生成协同学习模型,所述的无监督生成协同学习模型包括一个所述的生成器和一个所述的判别器;在训练过程中,交替训练生成器和判别器,首先,固定生成器,通过最小化判别器的损失来更新判别器的参数;然后,固定判别器,通过最小化生成器的损失来更新生成器的参数;通过负向学习反馈机制提高生成器的性能,直到生成器和判别器都达到收敛状态;步骤6),风险事件识别,使用已训练好的无监督生成协同学习模型进行营销风险事件的识别;步骤7),写入风险规则库,将判断为异常风险事件的数据写入风险规则库中,实时更新风险规则库
。2.
根据权利要求1所述的生成式营销事件风控规则库的构建方法,其特征在于,步骤2)中,所述的生成器为一个自动编码器,自动编码器由编码器和解码器组成,编码器将输入数据映射到潜在空间中的低维表示,而解码器则将潜在空间中的低维表示映射回原始数据空间
。3.
根据权利要求2所述的生成式营销事件风控规则库的构建方法,其特征在于,步骤2)中,所述生成器的训练过程如下:1)输入真实的营销风险事件样本数据;2)编码器将真实的营销风险事件样本数据转换为潜在表示向量;3)解码器将潜在表示向量解码为营销风险事件重构样本;4)计算重构样本与真实样本之间的差异,即重构损失;5)使用反向传播算法更新生成器的参数,以最小化重构损失,使重构样本更接近真实样本
。4.
根据权利要求1所述的生成式营销事件风控规则库的构建方法,其特征在于,步骤3)中,所述的判别器采用一种用于系统异常检测的模型,称为统一学习网络,在异常行为检测中,判别器使用隔离森林算法作为异常检测方法;判别器接受一个样本作为输入,并输出一个标量值,表示输入样本是真实样本还是重构样本
。5.
根据权利要求4所述的生成式营销事件风控规则库的构建方法,其特征在于,步骤3)中,所述的隔离森林算法是一...

【专利技术属性】
技术研发人员:杨柳欣孙钢沈然徐世予刘欢程杰慧蒋弋帆郭励罗宇恒方炳坤章一新金王英汪金荣谷泓杰章江铭
申请(专利权)人:国网浙江省电力有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1