基于行为序列的数据交互异常检测特征抽取方法及装置制造方法及图纸

技术编号:37507535 阅读:23 留言:0更新日期:2023-05-07 09:45
本发明专利技术实施例涉及一种基于行为序列的数据交互异常检测特征抽取方法及装置,包括:从行为序列数据中构造样本,得到数据交互样本集合;将所述数据交互样本集合输入至基于编码器

【技术实现步骤摘要】
基于行为序列的数据交互异常检测特征抽取方法及装置


[0001]本专利技术实施例涉及人工智能
,尤其涉及一种基于行为序列的数据交互异常检测特征抽取方法及装置。

技术介绍

[0002]电力、银行等传统基础行业数字化转型工作取得重大进展的同时,也面临新技术、新业务带来的各式安全挑战。其中“数据交互方式多样,隐藏在复杂交互过程的风险难以识别”是突出问题之一。数据交互过程中一类重要信息载体是行为序列,该数据按时序记录了实体在交互过程中的各个行为。例如,用户使用网上国网app进行缴费时会留下形如“登陆

搜索

缴费

退出”的页面访问序列。目前主流思路是从行为序列中提取特征,训练机器学习模型判断交互过程是否异常。其中,如何从行为序列中提取特征是直接决定异常检测效果的因素之一。
[0003]现有技术中,基于行为序列的特征提取方法可分为两类:一类是人工方式。业务人员利用领域知识从行为序列中提取统计特征。虽然该方式有一定效果,但难以对行为序列中的完整结构关系进行特征构建。以用户app页面访问序本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于行为序列的数据交互异常检测特征抽取方法,其特征在于,包括:从行为序列数据中构造样本,得到数据交互样本集合;将所述数据交互样本集合输入至基于编码器

解码器结构的模型中进行训练,其中,所述模型的解码器存在多步状态,每步状态的目标函数拟合当前及后续所有状态的真实值,拟合每步状态目标函数中的当前及后续状态时,通过预设分布为当前及后续状态赋予不同权重,模型的目标函数为每步状态目标函数累加;将所述模型中编码器的各状态输出的隐藏向量按预设方法融合,得到行为序列的特征。2.根据权利要求1所述的方法,其特征在于,所述从行为序列数据中构造样本,得到数据交互样本集合,包括:收集目标实体在交互过程中所有行为,按时序组织成一组序列数据,一组序列数据对应一个样本;将所述一组序列数据分成训练序列样本和预估序列样本。3.根据权利要求2所述的方法,其特征在于,所述将所述数据交互样本集合输入至基于编码器

解码器结构的模型中进行训练,包括:将所述数据交互样本集合中出现的每个行为进行词嵌入编码;基于每个行为对应的词嵌入编码,将所述训练序列样本作为所述模型中编码器的输入,提取训练序列特征;将所述预估序列样本作为解码器的真实标签,用来计算模型的目标函数。4.根据权利要求3所述的方法,其特征在于,所述每步状态的目标函数满足第一公式,所述第一公式为:;其中,表示第i个样本在解码器中第j个状态下的目标函数,,为预估序列样本长度,真实标签采用独热编码方式进行表示,为预测标签,为不同行为数量;在解码器第j个状态中拟合多个状态的同时,根据预设分布为每个状态分配权重,状态t离状态j越远,权重值越小。5.根据权利要求4所述的方法,其特征在于,所...

【专利技术属性】
技术研发人员:樊涛罗晨梅文明魏思佳孙炜石聪聪高先周张小建姚启桂
申请(专利权)人:国网智能电网研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1