用户行为数据处理方法、装置、设备及存储介质制造方法及图纸

技术编号：26775578 阅读：16 留言：0更新日期：2020-12-22 16:46

本申请实施例涉及云技术及人工智能，其公开了一种用户行为数据处理方法、装置、设备及存储介质，其中该方法包括：获取目标用户的历史模式序列数据和当前模式序列数据；该历史模式序列数据是基于目标用户的历史行为序列数据处理得到的，该当前模式序列数据是处理目标用户的当前行为序列数据得到的；通过目标特征提取模型对历史模式序列数据进行特征提取处理得到历史模式特征，通过目标特征提取模型对当前模式序列数据进行特征提取处理得到当前模式特征；根据该历史模式特征与该当前模式特征之间的相似度，确定与目标用户的当前行为序列数据对应的当前行为是否为作弊行为。该方法能够低成本、高适用性、高准确度地识别作弊行为。

全部详细技术资料下载

【技术实现步骤摘要】
用户行为数据处理方法、装置、设备及存储介质
本申请涉及人工智能(ArtificialIntelligence，AI)
与云技术，尤其涉及一种用户行为数据处理方法、装置、设备及存储介质。
技术介绍
在线上化、云技术带动各种场景蓬勃发展的大环境下，很多场景(如线上竞赛、广告、游戏等)中不可避免地出现了越来越多的作弊行为，为了更好地识别和打击作弊行为，反作弊已逐渐成为许多线上运营场景在风控安全策略控制中重要的一环。目前常见的作弊行为识别方法主要包括：基于决策树判别模型发现作弊行为的方法和基于人工设定的作弊规则识别作弊行为的方法。在基于决策树判别模型发现作弊行为的方法中，可以利用决策树判别模型根据用户特征识别用户是否存在作弊行为。在基于人工设定的作弊规则识别作弊行为的方法中，需要结合具体应用场景的特点将作弊可能采取的所有措施都列举出来，进而基于此梳理作弊规则，利用梳理出的作弊规则对作弊行为进行反制。上述作弊行为识别方法主要存在以下缺陷：基于决策树判别模型发现作弊行为的方法，需要利用标注样本对决策树判别模型进行训练，而构建大量标注样本需要花费较高的成本，构建少量标注样本又难以保证决策树判别模型的模型精度，即难以在训练成本和模型精度之间取得平衡。基于人工设定的作弊规则识别作弊行为的方法，通常需要引入相关领域的专家和先验知识梳理作弊规则，该作弊规则灵活性较低、不易扩展，对于复杂多变的线上场景，往往经过一段时间后作弊规则的覆盖率就会显著降低。综上所述，如何实现低成本、高适用性、高准确度地识别作弊行为，已成为目前

【技术保护点】
1.一种用户行为数据处理方法，其特征在于，所述方法包括：/n获取目标用户的历史模式序列数据和当前模式序列数据；所述历史模式序列数据是基于所述目标用户的历史行为序列数据处理得到的；所述当前模式序列数据是处理所述目标用户的当前行为序列数据得到的；/n通过目标特征提取模型对所述历史模式序列数据进行特征提取处理，得到历史模式特征；通过所述目标特征提取模型对所述当前模式序列数据进行特征提取处理，得到当前模式特征；/n根据所述历史模式特征与所述当前模式特征之间的相似度，确定与所述目标用户的所述当前行为序列数据对应的当前行为是否为作弊行为。/n

【技术特征摘要】
1.一种用户行为数据处理方法，其特征在于，所述方法包括：
获取目标用户的历史模式序列数据和当前模式序列数据；所述历史模式序列数据是基于所述目标用户的历史行为序列数据处理得到的；所述当前模式序列数据是处理所述目标用户的当前行为序列数据得到的；
通过目标特征提取模型对所述历史模式序列数据进行特征提取处理，得到历史模式特征；通过所述目标特征提取模型对所述当前模式序列数据进行特征提取处理，得到当前模式特征；
根据所述历史模式特征与所述当前模式特征之间的相似度，确定与所述目标用户的所述当前行为序列数据对应的当前行为是否为作弊行为。

2.根据权利要求1所述的方法，其特征在于，通过以下方式获得所述历史模式序列数据：
获取所述目标用户的N条历史行为序列数据，所述N为大于1的整数；
基于预设的策略标识和/或行为操作标识，将每条所述历史行为序列数据转换为对应的历史行为编码序列；
基于所述N条历史行为编码序列，构建目标前缀集合；所述目标前缀集合中包括多个满足预设支持度条件的目标前缀，其中，长度为i的目标前缀是基于长度为i-1的目标前缀对应的投影数据集确定的，所述i为大于1的整数；
确定所述目标前缀集合中长度最长的目标前缀，作为所述历史模式序列数据。

3.根据权利要求2所述的方法，其特征在于，通过以下方式确定所述长度为i的目标前缀：
针对每个长度为i-1的目标前缀，确定其对应的投影数据集中各投影数据单项各自对应的支持度，确定所对应的支持度大于最小支持度阈值的投影数据单项作为目标投影数据单项；合并所述长度为i-1的目标前缀和所述目标投影数据单项，得到所述长度为i的目标前缀。

4.根据权利要求1所述的方法，其特征在于，通过以下方式训练所述目标特征提取模型：
从策略知识库中获取训练样本数据；所述策略知识库用于存储具有对应关系的行为序列数据和标注策略；
通过待训练模型根据所述训练样本数据中的行为序列数据，确定预测策略结果；所述待训练模型由待训练特征提取模型和待训练分类模型组成；
根据所述训练样本数据中的标注策略和所述预测策略结果，对所述待训练模型进行训练；
确定所述待训练模型满足预设的训练结束条件后，将所述待训练模型中的所述待训练特征提取模型作为所述目标特征提取模型。

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：
获取所述目标用户的历史画像特征数据和当前画像特征数据；所述历史画像特征数据是根据所述目标用户的历史个人特征信息和/或历史行为特征信息确定的；所述当前画像特征数据是根据所述目标用户的当前个人特征信息和/或当前行为特征信息确定的；
则所述通过目标特征提取模型对所述历史模式序列数据进行特征提取处理，得到历史模式特征，包括：
对所述...

【专利技术属性】
技术研发人员：刘志煌，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人