用户行为数据处理方法、装置、设备及存储介质制造方法及图纸

技术编号:26775578 阅读:16 留言:0更新日期:2020-12-22 16:46
本申请实施例涉及云技术及人工智能,其公开了一种用户行为数据处理方法、装置、设备及存储介质,其中该方法包括:获取目标用户的历史模式序列数据和当前模式序列数据;该历史模式序列数据是基于目标用户的历史行为序列数据处理得到的,该当前模式序列数据是处理目标用户的当前行为序列数据得到的;通过目标特征提取模型对历史模式序列数据进行特征提取处理得到历史模式特征,通过目标特征提取模型对当前模式序列数据进行特征提取处理得到当前模式特征;根据该历史模式特征与该当前模式特征之间的相似度,确定与目标用户的当前行为序列数据对应的当前行为是否为作弊行为。该方法能够低成本、高适用性、高准确度地识别作弊行为。

【技术实现步骤摘要】
用户行为数据处理方法、装置、设备及存储介质
本申请涉及人工智能(ArtificialIntelligence,AI)
与云技术,尤其涉及一种用户行为数据处理方法、装置、设备及存储介质。
技术介绍
在线上化、云技术带动各种场景蓬勃发展的大环境下,很多场景(如线上竞赛、广告、游戏等)中不可避免地出现了越来越多的作弊行为,为了更好地识别和打击作弊行为,反作弊已逐渐成为许多线上运营场景在风控安全策略控制中重要的一环。目前常见的作弊行为识别方法主要包括:基于决策树判别模型发现作弊行为的方法和基于人工设定的作弊规则识别作弊行为的方法。在基于决策树判别模型发现作弊行为的方法中,可以利用决策树判别模型根据用户特征识别用户是否存在作弊行为。在基于人工设定的作弊规则识别作弊行为的方法中,需要结合具体应用场景的特点将作弊可能采取的所有措施都列举出来,进而基于此梳理作弊规则,利用梳理出的作弊规则对作弊行为进行反制。上述作弊行为识别方法主要存在以下缺陷:基于决策树判别模型发现作弊行为的方法,需要利用标注样本对决策树判别模型进行训练,而构建大量标注样本需要花费较高的成本,构建少量标注样本又难以保证决策树判别模型的模型精度,即难以在训练成本和模型精度之间取得平衡。基于人工设定的作弊规则识别作弊行为的方法,通常需要引入相关领域的专家和先验知识梳理作弊规则,该作弊规则灵活性较低、不易扩展,对于复杂多变的线上场景,往往经过一段时间后作弊规则的覆盖率就会显著降低。综上所述,如何实现低成本、高适用性、高准确度地识别作弊行为,已成为目前亟待解决的问题。
技术实现思路
有鉴于此,本申请实施例提供了一种用户行为数据处理方法、装置、设备及存储介质,能够实现低成本、高适用性、高准确度地识别作弊行为。本申请第一方面提供了一种用户行为数据处理方法,所述方法包括:获取目标用户的历史模式序列数据和当前模式序列数据;所述历史模式序列数据是基于所述目标用户的历史行为序列数据处理得到的;所述当前模式序列数据是处理所述目标用户的当前行为序列数据得到的;通过目标特征提取模型对所述历史模式序列数据进行特征提取处理,得到历史模式特征;通过所述目标特征提取模型对所述当前模式序列数据进行特征提取处理,得到当前模式特征;根据所述历史模式特征与所述当前模式特征之间的相似度,确定与所述目标用户的当前行为序列数据对应的当前行为是否为作弊行为。本申请第二方面提供了一种用户行为数据处理装置,所述装置包括:序列数据获取模块,用于获取目标用户的历史模式序列数据和当前模式序列数据;所述历史模式序列数据是基于所述目标用户的历史行为序列数据挖掘处理的;所述当前模式序列数据是处理所述目标用户的当前行为序列数据得到的;特征提取模块,用于通过目标特征提取模型对所述历史模式序列数据进行特征提取处理,得到历史模式特征;通过所述目标特征提取模型对所述当前模式序列数据进行特征提取处理,得到当前模式特征;作弊识别模块,用于根据所述历史模式特征与所述当前模式特征之间的相似度,确定与所述目标用户的当前行为序列数据对应的当前行为是否为作弊行为。本申请第三方面提供了一种电子设备,所述电子设备包括处理器以及存储器:所述存储器用于存储计算机程序;所述处理器用于根据所述计算机程序,执行如上述第一方面所述的用户行为数据处理方法的步骤。本申请第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述第一方面所述的用户行为数据处理方法的步骤。本申请第五方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述第一方面所述的用户行为数据处理方法的步骤。从以上技术方案可以看出,本申请实施例具有以下优点:本申请实施例提供了一种用户行为数据处理方法,在该方法中,先获取目标用户的历史模式序列数据和当前模式序列数据,该历史模式序列数据是基于目标用户的历史行为序列数据处理得到的,该当前模式序列数据是处理目标用户的当前行为序列数据得到的;然后,通过目标特征提取模型分别对历史模式序列数据和当前模式序列数据进行特征提取处理,得到对应的历史模式特征和当前模式特征;进而,根据历史模式特征和当前模式特征之间的相似度,确定与目标用户的当前行为序列数据对应的当前行为是否为作弊行为。由于历史模式序列数据是基于目标用户的历史行为序列数据处理得到的,其能够在一定程度上反映目标用户的操作习惯,因此,可以根据历史模式序列数据对应的历史模式特征与当前模式序列数据对应的当前模式特征之间的相似度,衡量目标用户的当前行为是否符合其以往的操作习惯,进而据此判断用户的当前行为是否为作弊行为。相比于基于决策树判别模型发现作弊行为的方法,本申请实施例提供的方法无需获取大量标注样本训练专用于识别作弊行为的模型,因此可以有效降低识别作弊行为的成本。相比于基于人工设定的作弊规则识别作弊行为的方法,本申请实施例提供的方法可以有效准确地识别作弊行为,场景适用性较高。附图说明图1为本申请实施例提供的用户行为数据处理方法的应用场景示意图;图2为本申请实施例提供的作用户行为数据处理方法的流程示意图;图3为本申请实施例提供的待训练模型的结构示意图;图4为本申请实施例提供的第一种用户行为数据处理装置的结构示意图;图5为本申请实施例提供的第二种用户行为数据处理装置的结构示意图;图6为本申请实施例提供的第三种用户行为数据处理装置的结构示意图;图7为本申请实施例提供的第四种用户行为数据处理装置的结构示意图;图8为本申请实施例提供的第五种用户行为数据处理装置的结构示意图;图9为本申请实施例提供的服务器的结构示意图;图10为本申请实施例提供的终端设备的结构示意图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。...

【技术保护点】
1.一种用户行为数据处理方法,其特征在于,所述方法包括:/n获取目标用户的历史模式序列数据和当前模式序列数据;所述历史模式序列数据是基于所述目标用户的历史行为序列数据处理得到的;所述当前模式序列数据是处理所述目标用户的当前行为序列数据得到的;/n通过目标特征提取模型对所述历史模式序列数据进行特征提取处理,得到历史模式特征;通过所述目标特征提取模型对所述当前模式序列数据进行特征提取处理,得到当前模式特征;/n根据所述历史模式特征与所述当前模式特征之间的相似度,确定与所述目标用户的所述当前行为序列数据对应的当前行为是否为作弊行为。/n

【技术特征摘要】
1.一种用户行为数据处理方法,其特征在于,所述方法包括:
获取目标用户的历史模式序列数据和当前模式序列数据;所述历史模式序列数据是基于所述目标用户的历史行为序列数据处理得到的;所述当前模式序列数据是处理所述目标用户的当前行为序列数据得到的;
通过目标特征提取模型对所述历史模式序列数据进行特征提取处理,得到历史模式特征;通过所述目标特征提取模型对所述当前模式序列数据进行特征提取处理,得到当前模式特征;
根据所述历史模式特征与所述当前模式特征之间的相似度,确定与所述目标用户的所述当前行为序列数据对应的当前行为是否为作弊行为。


2.根据权利要求1所述的方法,其特征在于,通过以下方式获得所述历史模式序列数据:
获取所述目标用户的N条历史行为序列数据,所述N为大于1的整数;
基于预设的策略标识和/或行为操作标识,将每条所述历史行为序列数据转换为对应的历史行为编码序列;
基于所述N条历史行为编码序列,构建目标前缀集合;所述目标前缀集合中包括多个满足预设支持度条件的目标前缀,其中,长度为i的目标前缀是基于长度为i-1的目标前缀对应的投影数据集确定的,所述i为大于1的整数;
确定所述目标前缀集合中长度最长的目标前缀,作为所述历史模式序列数据。


3.根据权利要求2所述的方法,其特征在于,通过以下方式确定所述长度为i的目标前缀:
针对每个长度为i-1的目标前缀,确定其对应的投影数据集中各投影数据单项各自对应的支持度,确定所对应的支持度大于最小支持度阈值的投影数据单项作为目标投影数据单项;合并所述长度为i-1的目标前缀和所述目标投影数据单项,得到所述长度为i的目标前缀。


4.根据权利要求1所述的方法,其特征在于,通过以下方式训练所述目标特征提取模型:
从策略知识库中获取训练样本数据;所述策略知识库用于存储具有对应关系的行为序列数据和标注策略;
通过待训练模型根据所述训练样本数据中的行为序列数据,确定预测策略结果;所述待训练模型由待训练特征提取模型和待训练分类模型组成;
根据所述训练样本数据中的标注策略和所述预测策略结果,对所述待训练模型进行训练;
确定所述待训练模型满足预设的训练结束条件后,将所述待训练模型中的所述待训练特征提取模型作为所述目标特征提取模型。


5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述目标用户的历史画像特征数据和当前画像特征数据;所述历史画像特征数据是根据所述目标用户的历史个人特征信息和/或历史行为特征信息确定的;所述当前画像特征数据是根据所述目标用户的当前个人特征信息和/或当前行为特征信息确定的;
则所述通过目标特征提取模型对所述历史模式序列数据进行特征提取处理,得到历史模式特征,包括:
对所述...

【专利技术属性】
技术研发人员:刘志煌
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1