数据处理方法、装置、设备、存储介质及计算机程序产品制造方法及图纸

技术编号:39324174 阅读:4 留言:0更新日期:2023-11-12 16:03
本申请公开了一种数据处理方法、装置、设备、存储介质及计算机程序产品,可应用于人工智能、云技术、区块链、智慧平台、应用软件等领域或场景的异常操作识别,该方法包括:获取待识别对象的基础画像特征和业务特征,其中,待识别对象与目标应用相关联,业务特征是基于所述待识别对象针对目标应用产生的交互数据确定的;将基础画像特征和业务特征进行融合处理,得到融合特征;将融合特征输入目标异常操作识别模型中进行处理,得到待识别对象的关于所述目标应用的异常操作识别结果;其中,目标异常操作识别模型是结合伪标签技术训练得到的。采用本申请,可以提高异常操作的识别准确性。性。性。

【技术实现步骤摘要】
数据处理方法、装置、设备、存储介质及计算机程序产品


[0001]本申请涉及人工智能
,尤其涉及数据处理方法、数据处理装置、数据处理设备、计算机可读存储介质及计算机程序产品。

技术介绍

[0002]随着计算机、电子、通信等技术的发展,智能终端(如手机,电脑等)目前已被广泛使用于人们的日常生活中,为满足人们对于智能终端的功能多样性需求,各种应用(Application,APP)应运而生。各种应用给人们带来了便利,也丰富了人们的体验。但有的用户也可能利用应用进行异常操作,如利用应用进行诸如恶意请求、刷单等操作。异常操作可能会加大应用服务器的负载,不利于应用服务器运行;也可能会产生虚假的操作数据,不利于应用所涉及业务的分析。因此,如何识别是否存在异常操作是很有必要的。

技术实现思路

[0003]本申请提供了一种数据处理方法、装置、设备、存储介质及计算机程序产品,可提高异常操作的识别准确性。
[0004]一方面,本申请提供了一种数据处理方法,包括:
[0005]获取待识别对象的基础画像特征和业务特征,待识别对象与目标应用相关联,业务特征是基于待识别对象针对目标应用产生的交互数据确定的;
[0006]将基础画像特征和所述业务特征进行融合处理,得到融合特征;
[0007]将融合特征输入目标异常操作识别模型中进行处理,得到待识别对象的关于目标应用的异常操作识别结果;
[0008]其中,目标异常操作识别模型是基于第一训练样本集和第二训练样本集训练得到,第一训练样本集包括已标注标签的第一样本数据和未标注标签的第二样本数据;第二训练样本集是基于第一样本数据和确定出伪标签的第二样本数据所构建的,伪标签是利用初始训练后的异常操作识别模型对第二样本数据进行处理得到的预测标签;初始训练后的异常操作识别模型是利用所述第一样本数据对初始异常操作识别模型训练得到,目标异常操作识别模型是利用第二训练样本集对初始训练后的异常操作识别模型进行训练得到;样本数据包括目标应用的关联对象的特征数据,样本数据的标签用于指示关联对象是否存在异常操作。
[0009]一方面,本申请提供了一种数据处理装置,包括:
[0010]获取单元,用于获取待识别对象的基础画像特征和业务特征,待识别对象与目标应用相关联,业务特征是基于待识别对象针对目标应用产生的交互数据确定的;
[0011]处理单元,用于将基础画像特征和所述业务特征进行融合处理,得到融合特征;
[0012]所述处理单元,还用于将融合特征输入目标异常操作识别模型中进行处理,得到待识别对象的关于目标应用的异常操作识别结果;
[0013]其中,目标异常操作识别模型是基于第一训练样本集和第二训练样本集训练得
到,第一训练样本集包括已标注标签的第一样本数据和未标注标签的第二样本数据;第二训练样本集是基于第一样本数据和确定出伪标签的第二样本数据所构建的,伪标签是利用初始训练后的异常操作识别模型对第二样本数据进行处理得到的预测标签;初始训练后的异常操作识别模型是利用所述第一样本数据对初始异常操作识别模型训练得到,目标异常操作识别模型是利用第二训练样本集对初始训练后的异常操作识别模型进行训练得到;样本数据包括目标应用的关联对象的特征数据,样本数据的标签用于指示关联对象是否存在异常操作。
[0014]在一种实现方式中,目标异常操作识别模型包括特征提取模块以及并行连接的互协方差聚合模块和二阶表征聚合模块;互协方差聚合模块和二阶表征聚合模块的输入分别与初始特征提取模块的输出连接。
[0015]在一种实现方式中,处理单元还用于:将融合特征输入所述特征提取模块中进行处理,得到中间特征;将中间特征输入互协方差聚合模块中进行处理,得到互协方差特征,以及将中间特征输入二阶表征聚合模块中进行处理,得到二阶聚合特征;将互协方差特征和二阶聚合特征进行拼接处理,得到拼接特征;基于拼接特征确定待识别对象的关于目标应用的异常操作识别结果。
[0016]在一种实现方式中,获取单元还用于获取待识别对象的基础画像,基础画像包括对象基础属性、设备基础属性、网络连接属性以及地理位置属性中的一种或者多种,设备基础属性、网络连接属性和地理位置属性是基于第一时间段内待识别对象操作目标应用的过程中产生的相关数据确定的;处理单元还用于根据基础画像确定待识别对象的基础画像特征。
[0017]在一种实现方式中,获取单元还用于获取第二时间段内待识别对象操作目标应用的过程中所产生的交互数据,交互数据包括登录操作相关信息、针对特定业务的点击信息和转化信息、应用流量信息以及特定功能的触发信息中的一种或者多种;处理单元还用于根据交互数据确定待识别对象的业务特征。
[0018]在一种实现方式中,处理单元还用于:对基础画像特征中的数值型特征进行归一化处理,以及对基础画像特征中的非数值型特征进行离散化处理,得到处理后的基础画像特征;对业务特征中的数值型特征进行归一化处理,以及对业务特征中的非数值型特征进行离散化处理,得到处理后的业务特征;将处理后的基础画像特征和处理后的业务特征进行融合处理,得到融合特征。
[0019]在一种实现方式中,处理单元还用于:将中间特征输入互协方差聚合模块中进行处理,确定中间特征的归一化特征;计算中间特征和归一化特征的外积;将中间特征和归一化特征的外积进行向量化处理,得到互协方差特征。
[0020]在一种实现方式中,处理单元还用于:将中间特征输入二阶表征聚合模块中进行处理,确定中间特征的特征矩阵;基于特征矩阵和特征矩阵的转置矩阵确定二阶聚合矩阵;计算二阶聚合矩阵的矩阵平方根,对矩阵平方根进行向量化处理,得到二阶聚合特征。
[0021]一方面,本申请提供了一种数据处理设备,包括处理器,适于实现一条或多条计算机程序;以及计算机存储介质,所述计算机存储介质存储有一条或多条计算机程序,所述一条或多条计算机程序由该处理器加载并实现本申请提供的数据处理方法。
[0022]一方面,本申请提供了一种计算机可读存储介质,该计算机可读存储介质存储有
计算机程序,该计算机程序包括程序指令,该程序指令被处理器执行时使该处理器实现本申请提供的数据处理方法。
[0023]一方面,本申请提供了一种计算机程序产品,该计算机程序产品包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备实现本申请提供的数据处理方法。
[0024]本申请中的异常操作识别模型是结合伪标签技术训练得到的,这样可以在已标注标签的样本数据的数量不足以训练好异常操作识别模型时,也能通过确定未标注标签的样本数据的伪标签,增大具备标签的样本数据的数量,从而训练好异常操作识别模型,且提高训练后的异常操作识别模型识别准确性。在进行异常操作识别时,获取与目标应用相关联的待识别对象的基础画像特征与业务特征,对基础画像特征和业务特征进行融合处理,得到融合特征,然后将该融合特征输入上述结合本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取待识别对象的基础画像特征和业务特征,所述待识别对象与目标应用相关联,所述业务特征是基于所述待识别对象针对目标应用产生的交互数据确定的;将所述基础画像特征和所述业务特征进行融合处理,得到融合特征;将所述融合特征输入目标异常操作识别模型中进行处理,得到所述待识别对象的关于所述目标应用的异常操作识别结果;其中,所述目标异常操作识别模型是基于第一训练样本集和第二训练样本集训练得到,所述第一训练样本集包括已标注标签的第一样本数据和未标注标签的第二样本数据;所述第二训练样本集是基于所述第一样本数据和确定出伪标签的第二样本数据所构建的,所述伪标签是利用初始训练后的异常操作识别模型对所述第二样本数据进行处理得到的预测标签;所述初始训练后的异常操作识别模型是利用所述第一样本数据对初始异常操作识别模型训练得到,所述目标异常操作识别模型是利用所述第二训练样本集对所述初始训练后的异常操作识别模型进行训练得到;样本数据包括所述目标应用的关联对象的特征数据,样本数据的标签用于指示所述关联对象是否存在异常操作。2.根据权利要求1所述的方法,其特征在于,所述目标异常操作识别模型包括特征提取模块以及并行连接的互协方差聚合模块和二阶表征聚合模块;所述互协方差聚合模块和所述二阶表征聚合模块的输入分别与所述初始特征提取模块的输出连接。3.根据权利要求2所述的方法,其特征在于,所述将所述融合特征输入目标异常操作识别模型中进行处理,得到所述待识别对象的关于所述目标应用的异常操作识别结果,包括:将所述融合特征输入所述特征提取模块中进行处理,得到中间特征;将所述中间特征输入所述互协方差聚合模块中进行处理,得到互协方差特征,以及将所述中间特征输入所述二阶表征聚合模块中进行处理,得到二阶聚合特征;将所述互协方差特征和所述二阶聚合特征进行拼接处理,得到拼接特征;基于所述拼接特征确定所述待识别对象的关于所述目标应用的异常操作识别结果。4.根据权利要求1

3任一项所述的方法,其特征在于,所述获取待识别对象的基础画像特征,包括:获取所述待识别对象的基础画像,所述基础画像包括对象基础属性、设备基础属性、网络连接属性以及地理位置属性中的一种或者多种,所述设备基础属性、所述网络连接属性和所述地理位置属性是基于第一时间段内所述待识别对象操作所述目标应用的过程中产生的相关数据确定的;根据所述基础画像确定所述待识别对象的基础画像特征。5.根据权利要求1

3任一项所述的方法,其特征在于,获取所述待识别对象的业务特征,包括:获取第二时间段内所述待识别对象操作所述目标应用的过程中所产生的交互数据,所述交互数据包括登录操作相关信息、针对特定业务的点击信息和转化信息、应用流量信息以及特定功能的触发信息中的一种或者多种;根据所述交互数据确定所述待识别对象的业务特征。6.根据权利要求1所述的方法,其特征在于,所述将所述基础画像特征和所述业务特征进行融合处理,得到融合特征,包括:
对所述基础画像特征中的数值型特征进行归一化处理,以及对...

【专利技术属性】
技术研发人员:樊鹏
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1