一种数据处理方法、装置、计算机及可读存储介质制造方法及图纸

技术编号:27060858 阅读:14 留言:0更新日期:2021-01-15 14:41
本申请实施例公开了一种数据处理方法、装置、计算机及可读存储介质,可以使用人工智能领域的机器学习及云技术领域的云存储等技术,该方法包括:获取用户针对目标业务的行为序列矩阵;基于异常识别模型中的连续卷积网络,对行为序列矩阵进行连续卷积,获取用户的连续特征矩阵;基于异常识别模型中的扩张卷积网络,对行为序列矩阵进行扩张卷积,获取用户的扩张特征矩阵;对连续特征矩阵及扩张特征矩阵进行特征融合,得到融合特征向量;将融合特征向量输入到异常识别模型中的全局特征融合模块中以得到异常概率;根据异常概率确定用户针对目标业务的行为识别结果。采用本申请,可以提高特征提取的全面性,提高数据处理的准确性。

【技术实现步骤摘要】
一种数据处理方法、装置、计算机及可读存储介质
本申请涉及计算机
,尤其涉及一种数据处理方法、装置、计算机及可读存储介质。
技术介绍
在用户玩游戏的过程中,会产生很多的行为日志,该行为日志中包括许多行为序列数据,例如大型多人在线角色扮演游戏(MassiveMultiplayerOnlineRole-PlayingGame,MMORPG)等大型端游中的行为序列数据。对于不同的用户,其偏好的行为模式有所不同,存在各种各样的行为序列数据,但是异常用户一般偏向于进行能够产生高收益的行为,产生高收益的行为序列数据往往有其特定的行为模式。再者,如果是群体约定操作,其行为序列数据则更加相似。通过玩家的行为序列数据来挖掘出异常用户,有一定的应用价值和可行性。对于不定长的行为序列数据进行异常识别,一般是通过统计等手段找到一些显著的特征,然后结合人工设定的规则来判定异常用户。或者通过特征工程的手段找到一组特征基底,然后把不定长的行为序列数据映射到固定维度的特征向量,最后通过建立机器学习模型的方式判断异常的行为序列数据。其中,把不定长的序列数据映射为定长的特征向量的方法一般有N元-模型(N-Gram)的方法和基于词组向量化(Word2Vec)的方法。直接基于统计特征的机器学习模型对行为序列数据进行识别,需要较强的业务理解经验和繁杂的特征工程阶段,而且对行为序列数据中的一些特征无法全面获取,使得对行为序列数据的识别准确性较低。
技术实现思路
本申请实施例提供了一种数据处理方法、装置、计算机及可读存储介质,可以提高特征提取的全面性,提高数据处理的准确性。本申请实施例一方面提供了一种数据处理方法,该方法包括:获取用户针对目标业务的行为序列矩阵;基于异常识别模型中的连续卷积网络,对行为序列矩阵进行连续卷积,获取用户的连续特征矩阵;基于异常识别模型中的扩张卷积网络,对行为序列矩阵进行扩张卷积,获取用户的扩张特征矩阵;扩张卷积是指对行为序列矩阵中元素间隔为e的矩阵元素进行卷积,e为正整数,e是根据扩张卷积网络的扩张系数所确定的;对连续特征矩阵及扩张特征矩阵进行特征融合,得到融合特征向量;将融合特征向量输入到异常识别模型中的全局特征融合模块中以得到异常概率;根据异常概率确定用户针对目标业务的行为识别结果。其中,获取用户针对目标业务的行为序列矩阵,包括:获取用户的初始行为序列数据及模型序列长度,根据模型序列长度将初始行为序列数据转换为行为序列数据;行为序列数据包括p个行为元素,p为模型序列长度;将p个行为元素中的各个行为元素映射为初始特征向量,将各个行为元素分别映射得到的初始特征向量进行拼接,得到行为序列矩阵。其中,连续卷积网络包括N个连续卷积子网络,各个连续卷积子网络对应的连续卷积宽度不同;N为正整数;基于异常识别模型中的连续卷积网络,对行为序列矩阵进行连续卷积,获取用户的连续特征矩阵,包括:在异常识别模型中,将行为序列矩阵输入第i个连续卷积子网络中,在第i个连续卷积子网络中,以第i个连续卷积子网络对应的连续卷积宽度,对行为序列矩阵进行卷积,得到用户的第i个连续特征矩阵,直至获取到用户的N个连续特征矩阵;i为正整数,i小于或等于N。其中,第i个连续卷积子网络包括d1个连续卷积核,d1个连续卷积核中的各个连续卷积核的卷积参数不同;在第i个连续卷积子网络中,以第i个连续卷积子网络对应的连续卷积宽度,对行为序列矩阵进行卷积,得到用户的第i个连续特征矩阵,包括:在第i个连续卷积子网络中,根据第i个连续卷积子网络对应的连续卷积宽度,采用d1个连续卷积核分别对行为序列矩阵进行卷积,提取行为序列矩阵对应的d1个第一特征向量;对d1个第一特征向量进行特征拼接,得到用户的第i个连续特征矩阵。其中,扩张卷积网络包括M个扩张卷积子网络,各个扩张卷积子网络对应的扩张卷积宽度不同;M为正整数;基于异常识别模型中的扩张卷积网络,对行为序列矩阵进行扩张卷积,获取用户的扩张特征矩阵,包括:在异常识别模型中,将行为序列矩阵输入第j个扩张卷积子网络中,在第j个扩张卷积子网络中,以第j个扩张卷积子网络对应的扩张卷积宽度,对行为序列矩阵进行卷积,得到用户的第j个扩张特征矩阵,直至获取到用户的M个扩张特征矩阵;j为正整数,j小于或等于M。其中,第j个扩张卷积子网络包括第一扩张卷积层及第二扩张卷积层;第二扩张卷积层为第一扩张卷积层的下一个卷积层;在第j个扩张卷积子网络中,以第j个扩张卷积子网络对应的扩张卷积宽度,对行为序列矩阵进行卷积,得到用户的第j个扩张特征矩阵,包括:在第j个扩张卷积子网络中,获取第一扩张卷积的第一扩张系数,将行为序列矩阵输入第一扩张卷积层,根据第一扩张系数及第j个扩张卷积子网络对应的扩张卷积宽度,确定第一扩张卷积层的第一卷积采样点;基于第一卷积采样点,对输入矩阵进行卷积,得到第一扩张卷积层的输出矩阵;若第一扩张卷积层为第j个扩张卷积子网络中的第一个卷积层,则输入矩阵为行为序列矩阵;若第一扩张卷积层不为第j个扩张卷积子网络中的第一个卷积层,则输入矩阵为第一扩张卷积层的上一个卷积层的输出矩阵;根据第一扩张系数及第j个扩张卷积子网络对应的扩张卷积宽度,确定第二扩张卷积层的第二扩张系数;将第一扩张卷积层的输出矩阵输入第二扩张卷积层,根据第二扩张系数及第j个扩张卷积子网络对应的扩张卷积宽度,确定第二扩张卷积层的第二卷积采样点;基于第二卷积采样点,对第一扩张卷积层的输出矩阵进行卷积,得到第二扩张卷积层的输出矩阵;若第二扩张卷积层不为第j个扩张卷积子网络中的最后一个卷积层,则将第二扩张卷积层的输出矩阵确定为第二扩张卷积层的下一个卷积层的输入矩阵;若第二扩张卷积层为第j个扩张卷积子网络中的最后一个卷积层,则将第二扩张卷积层的输出矩阵确定为用户的第j个扩张特征矩阵。其中,第一扩张卷积层包括d2个扩张卷积核,d2个扩张卷积核中的各个扩张卷积核的卷积参数不同;基于第一卷积采样点,对输入矩阵进行卷积,得到第一扩张卷积层的输出矩阵,包括:基于第一卷积采样点,采用d2个扩张卷积核分别对输入矩阵进行卷积,提取输入矩阵对应的d2个第二特征向量;对d2个第二特征向量进行特征拼接,得到第一扩张卷积层的输出矩阵。其中,对连续特征矩阵及扩张特征矩阵进行特征融合,得到融合特征向量,包括:获取第一权重向量,基于第一权重向量对连续特征矩阵中的每一列元素分别进行加权求和,得到连续特征矩阵的第一粗粒度向量;获取第一权重矩阵,将第一权重矩阵与连续特征矩阵进行点乘,得到第一加权细粒度矩阵,对第一加权细粒度矩阵中的每一列元素进行特征融合,得到连续特征矩阵的第一细粒度向量;获取第二权重向量,基于第二权重向量对扩张特征矩阵中的每一列元素进行加权求和,得到扩张特征矩阵的第二粗粒度向量;获取第二权重矩阵,对第二权重矩阵与扩张特征矩阵进行点乘,得到本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:/n获取用户针对目标业务的行为序列矩阵;/n基于异常识别模型中的连续卷积网络,对所述行为序列矩阵进行连续卷积,获取所述用户的连续特征矩阵;/n基于所述异常识别模型中的扩张卷积网络,对所述行为序列矩阵进行扩张卷积,获取所述用户的扩张特征矩阵;所述扩张卷积是指对所述行为序列矩阵中元素间隔为e的矩阵元素进行卷积,e为正整数,e是根据所述扩张卷积网络的扩张系数所确定的;/n对所述连续特征矩阵及所述扩张特征矩阵进行特征融合,得到融合特征向量;/n将所述融合特征向量输入到所述异常识别模型中的全局特征融合模块中以得到异常概率;/n根据所述异常概率确定所述用户针对所述目标业务的行为识别结果。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
获取用户针对目标业务的行为序列矩阵;
基于异常识别模型中的连续卷积网络,对所述行为序列矩阵进行连续卷积,获取所述用户的连续特征矩阵;
基于所述异常识别模型中的扩张卷积网络,对所述行为序列矩阵进行扩张卷积,获取所述用户的扩张特征矩阵;所述扩张卷积是指对所述行为序列矩阵中元素间隔为e的矩阵元素进行卷积,e为正整数,e是根据所述扩张卷积网络的扩张系数所确定的;
对所述连续特征矩阵及所述扩张特征矩阵进行特征融合,得到融合特征向量;
将所述融合特征向量输入到所述异常识别模型中的全局特征融合模块中以得到异常概率;
根据所述异常概率确定所述用户针对所述目标业务的行为识别结果。


2.如权利要求1所述的方法,其特征在于,所述获取用户针对目标业务的行为序列矩阵,包括:
获取用户的初始行为序列数据及模型序列长度,根据所述模型序列长度将所述初始行为序列数据转换为行为序列数据;所述行为序列数据包括p个行为元素,p为所述模型序列长度;
将p个行为元素中的各个行为元素映射为初始特征向量,将所述各个行为元素分别映射得到的初始特征向量进行拼接,得到所述行为序列矩阵。


3.如权利要求1所述的方法,其特征在于,所述连续卷积网络包括N个连续卷积子网络,各个连续卷积子网络对应的连续卷积宽度不同;N为正整数;
所述基于异常识别模型中的连续卷积网络,对所述行为序列矩阵进行连续卷积,获取所述用户的连续特征矩阵,包括:
在异常识别模型中,将所述行为序列矩阵输入第i个连续卷积子网络中,在所述第i个连续卷积子网络中,以所述第i个连续卷积子网络对应的连续卷积宽度,对所述行为序列矩阵进行卷积,得到所述用户的第i个连续特征矩阵,直至获取到所述用户的N个连续特征矩阵;i为正整数,i小于或等于N。


4.如权利要求3所述的方法,其特征在于,所述第i个连续卷积子网络包括d1个连续卷积核,所述d1个连续卷积核中的各个连续卷积核的卷积参数不同;
所述在所述第i个连续卷积子网络中,以所述第i个连续卷积子网络对应的连续卷积宽度,对所述行为序列矩阵进行卷积,得到所述用户的第i个连续特征矩阵,包括:
在所述第i个连续卷积子网络中,根据所述第i个连续卷积子网络对应的连续卷积宽度,采用所述d1个连续卷积核分别对所述行为序列矩阵进行卷积,提取所述行为序列矩阵对应的d1个第一特征向量;
对所述d1个第一特征向量进行特征拼接,得到所述用户的第i个连续特征矩阵。


5.如权利要求1所述的方法,其特征在于,所述扩张卷积网络包括M个扩张卷积子网络,各个扩张卷积子网络对应的扩张卷积宽度不同;M为正整数;
所述基于所述异常识别模型中的扩张卷积网络,对所述行为序列矩阵进行扩张卷积,获取所述用户的扩张特征矩阵,包括:
在所述异常识别模型中,将所述行为序列矩阵输入第j个扩张卷积子网络中,在所述第j个扩张卷积子网络中,以所述第j个扩张卷积子网络对应的扩张卷积宽度,对所述行为序列矩阵进行卷积,得到所述用户的第j个扩张特征矩阵,直至获取到所述用户的M个扩张特征矩阵;j为正整数,j小于或等于M。


6.如权利要求5所述的方法,其特征在于,所述第j个扩张卷积子网络包括第一扩张卷积层及第二扩张卷积层;所述第二扩张卷积层为所述第一扩张卷积层的下一个卷积层;
所述在所述第j个扩张卷积子网络中,以所述第j个扩张卷积子网络对应的扩张卷积宽度,对所述行为序列矩阵进行卷积,得到所述用户的第j个扩张特征矩阵,包括:
在所述第j个扩张卷积子网络中,获取所述第一扩张卷积的第一扩张系数,将所述行为序列矩阵输入所述第一扩张卷积层,根据所述第一扩张系数及所述第j个扩张卷积子网络对应的扩张卷积宽度,确定所述第一扩张卷积层的第一卷积采样点;
基于所述第一卷积采样点,对输入矩阵进行卷积,得到所述第一扩张卷积层的输出矩阵;若所述第一扩张卷积层为所述第j个扩张卷积子网络中的第一个卷积层,则所述输入矩阵为所述行为序列矩阵;若所述第一扩张卷积层不为所述第j个扩张卷积子网络中的第一个卷积层,则所述输入矩阵为所述第一扩张卷积层的上一个卷积层的输出矩阵;
根据所述第一扩张系数及所述第j个扩张卷积子网络对应的扩张卷积宽度,确定所述第二扩张卷积层的第二扩张系数;
将所述第一扩张卷积层的输出矩阵输入所述第二扩张卷积层,根据所述第二扩张系数及所述第j个扩张卷积子网络对应的扩张卷积宽度,确定所述第二扩张卷积层的第二卷积采样点;
基于所述第二卷积采样点,对所述第一扩张卷积层的输出矩阵进行卷积,得到所述第二扩张卷积层的输出矩阵;
若所述第二扩张卷积层不为所述第j个扩张卷积子网络中的最后一个卷积层,则将所述第二扩张卷积层的输出矩阵确定为所述第二扩张卷积层的下一个卷积层的输入矩阵;
若所述第二扩张卷积层为所述第j个扩张卷积子网络中的最后一个卷积层,则将所述第二扩张卷积层的输出矩阵确...

【专利技术属性】
技术研发人员:陈观钦陈健柯陈远王摘星钟芬芬
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1