一种数据处理方法、装置、计算机及可读存储介质制造方法及图纸

技术编号：27060858 阅读：14 留言：0更新日期：2021-01-15 14:41

本申请实施例公开了一种数据处理方法、装置、计算机及可读存储介质，可以使用人工智能领域的机器学习及云技术领域的云存储等技术，该方法包括：获取用户针对目标业务的行为序列矩阵；基于异常识别模型中的连续卷积网络，对行为序列矩阵进行连续卷积，获取用户的连续特征矩阵；基于异常识别模型中的扩张卷积网络，对行为序列矩阵进行扩张卷积，获取用户的扩张特征矩阵；对连续特征矩阵及扩张特征矩阵进行特征融合，得到融合特征向量；将融合特征向量输入到异常识别模型中的全局特征融合模块中以得到异常概率；根据异常概率确定用户针对目标业务的行为识别结果。采用本申请，可以提高特征提取的全面性，提高数据处理的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理方法、装置、计算机及可读存储介质
本申请涉及计算机
，尤其涉及一种数据处理方法、装置、计算机及可读存储介质。
技术介绍
在用户玩游戏的过程中，会产生很多的行为日志，该行为日志中包括许多行为序列数据，例如大型多人在线角色扮演游戏(MassiveMultiplayerOnlineRole-PlayingGame，MMORPG)等大型端游中的行为序列数据。对于不同的用户，其偏好的行为模式有所不同，存在各种各样的行为序列数据，但是异常用户一般偏向于进行能够产生高收益的行为，产生高收益的行为序列数据往往有其特定的行为模式。再者，如果是群体约定操作，其行为序列数据则更加相似。通过玩家的行为序列数据来挖掘出异常用户，有一定的应用价值和可行性。对于不定长的行为序列数据进行异常识别，一般是通过统计等手段找到一些显著的特征，然后结合人工设定的规则来判定异常用户。或者通过特征工程的手段找到一组特征基底，然后把不定长的行为序列数据映射到固定维度的特征向量，最后通过建立机器学习模型的方式判断异常的行为序列数据。其中，把不定长的序列数据映射为定长的特征向量的方法一般有N元-模型(N-Gram)的方法和基于词组向量化(Word2Vec)的方法。直接基于统计特征的机器学习模型对行为序列数据进行识别，需要较强的业务理解经验和繁杂的特征工程阶段，而且对行为序列数据中的一些特征无法全面获取，使得对行为序列数据的识别准确性较低。
技术实现思路
本申请实施例提供了一种数据处理方法、装置、计算机及可读存储介质，可以提高特征...

【技术保护点】
1.一种数据处理方法，其特征在于，所述方法包括：/n获取用户针对目标业务的行为序列矩阵；/n基于异常识别模型中的连续卷积网络，对所述行为序列矩阵进行连续卷积，获取所述用户的连续特征矩阵；/n基于所述异常识别模型中的扩张卷积网络，对所述行为序列矩阵进行扩张卷积，获取所述用户的扩张特征矩阵；所述扩张卷积是指对所述行为序列矩阵中元素间隔为e的矩阵元素进行卷积，e为正整数，e是根据所述扩张卷积网络的扩张系数所确定的；/n对所述连续特征矩阵及所述扩张特征矩阵进行特征融合，得到融合特征向量；/n将所述融合特征向量输入到所述异常识别模型中的全局特征融合模块中以得到异常概率；/n根据所述异常概率确定所述用户针对所述目标业务的行为识别结果。/n

【技术特征摘要】
1.一种数据处理方法，其特征在于，所述方法包括：
获取用户针对目标业务的行为序列矩阵；
基于异常识别模型中的连续卷积网络，对所述行为序列矩阵进行连续卷积，获取所述用户的连续特征矩阵；
基于所述异常识别模型中的扩张卷积网络，对所述行为序列矩阵进行扩张卷积，获取所述用户的扩张特征矩阵；所述扩张卷积是指对所述行为序列矩阵中元素间隔为e的矩阵元素进行卷积，e为正整数，e是根据所述扩张卷积网络的扩张系数所确定的；
对所述连续特征矩阵及所述扩张特征矩阵进行特征融合，得到融合特征向量；
将所述融合特征向量输入到所述异常识别模型中的全局特征融合模块中以得到异常概率；
根据所述异常概率确定所述用户针对所述目标业务的行为识别结果。

2.如权利要求1所述的方法，其特征在于，所述获取用户针对目标业务的行为序列矩阵，包括：
获取用户的初始行为序列数据及模型序列长度，根据所述模型序列长度将所述初始行为序列数据转换为行为序列数据；所述行为序列数据包括p个行为元素，p为所述模型序列长度；
将p个行为元素中的各个行为元素映射为初始特征向量，将所述各个行为元素分别映射得到的初始特征向量进行拼接，得到所述行为序列矩阵。

3.如权利要求1所述的方法，其特征在于，所述连续卷积网络包括N个连续卷积子网络，各个连续卷积子网络对应的连续卷积宽度不同；N为正整数；
所述基于异常识别模型中的连续卷积网络，对所述行为序列矩阵进行连续卷积，获取所述用户的连续特征矩阵，包括：
在异常识别模型中，将所述行为序列矩阵输入第i个连续卷积子网络中，在所述第i个连续卷积子网络中，以所述第i个连续卷积子网络对应的连续卷积宽度，对所述行为序列矩阵进行卷积，得到所述用户的第i个连续特征矩阵，直至获取到所述用户的N个连续特征矩阵；i为正整数，i小于或等于N。

4.如权利要求3所述的方法，其特征在于，所述第i个连续卷积子网络包括d1个连续卷积核，所述d1个连续卷积核中的各个连续卷积核的卷积参数不同；
所述在所述第i个连续卷积子网络中，以所述第i个连续卷积子网络对应的连续卷积宽度，对所述行为序列矩阵进行卷积，得到所述用户的第i个连续特征矩阵，包括：
在所述第i个连续卷积子网络中，根据所述第i个连续卷积子网络对应的连续卷积宽度，采用所述d1个连续卷积核分别对所述行为序列矩阵进行卷积，提取所述行为序列矩阵对应的d1个第一特征向量；
对所述d1个第一特征向量进行特征拼接，得到所述用户的第i个连续特征矩阵。

5.如权利要求1所述的方法，其特征在于，所述扩张卷积网络包括M个扩张卷积子网络，各个扩张卷积子网络对应的扩张卷积宽度不同；M为正整数；
所述基于所述异常识别模型中的扩张卷积网络，对所述行为序列矩阵进行扩张卷积，获取所述用户的扩张特征矩阵，包括：
在所述异常识别模型中，将所述行为序列矩阵输入第j个扩张卷积子网络中，在所述第j个扩张卷积子网络中，以所述第j个扩张卷积子网络对应的扩张卷积宽度，对所述行为序列矩阵进行卷积，得到所述用户的第j个扩张特征矩阵，直至获取到所述用户的M个扩张特征矩阵；j为正整数，j小于或等于M。

6.如权利要求5所述的方法，其特征在于，所述第j个扩张卷积子网络包括第一扩张卷积层及第二扩张卷积层；所述第二扩张卷积层为所述第一扩张卷积层的下一个卷积层；
所述在所述第j个扩张卷积子网络中，以所述第j个扩张卷积子网络对应的扩张卷积宽度，对所述行为序列矩阵进行卷积，得到所述用户的第j个扩张特征矩阵，包括：
在所述第j个扩张卷积子网络中，获取所述第一扩张卷积的第一扩张系数，将所述行为序列矩阵输入所述第一扩张卷积层，根据所述第一扩张系数及所述第j个扩张卷积子网络对应的扩张卷积宽度，确定所述第一扩张卷积层的第一卷积采样点；
基于所述第一卷积采样点，对输入矩阵进行卷积，得到所述第一扩张卷积层的输出矩阵；若所述第一扩张卷积层为所述第j个扩张卷积子网络中的第一个卷积层，则所述输入矩阵为所述行为序列矩阵；若所述第一扩张卷积层不为所述第j个扩张卷积子网络中的第一个卷积层，则所述输入矩阵为所述第一扩张卷积层的上一个卷积层的输出矩阵；
根据所述第一扩张系数及所述第j个扩张卷积子网络对应的扩张卷积宽度，确定所述第二扩张卷积层的第二扩张系数；
将所述第一扩张卷积层的输出矩阵输入所述第二扩张卷积层，根据所述第二扩张系数及所述第j个扩张卷积子网络对应的扩张卷积宽度，确定所述第二扩张卷积层的第二卷积采样点；
基于所述第二卷积采样点，对所述第一扩张卷积层的输出矩阵进行卷积，得到所述第二扩张卷积层的输出矩阵；
若所述第二扩张卷积层不为所述第j个扩张卷积子网络中的最后一个卷积层，则将所述第二扩张卷积层的输出矩阵确定为所述第二扩张卷积层的下一个卷积层的输入矩阵；
若所述第二扩张卷积层为所述第j个扩张卷积子网络中的最后一个卷积层，则将所述第二扩张卷积层的输出矩阵确...

【专利技术属性】
技术研发人员：陈观钦，陈健柯，陈远，王摘星，钟芬芬，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人