数据处理方法及装置、电子设备、存储介质、程序产品制造方法及图纸

技术编号:37958851 阅读:5 留言:0更新日期:2023-06-30 09:33
本申请揭示了一种数据处理方法及装置、电子设备、存储介质、程序产品。该方法包括:根据预设的内容异常判定规则对目标对象的特征信息进行内容分析,获得特征信息对应的内容分析结果;根据预设的异常信息集合对内容分析结果指示内容正常的特征信息进行关联分析,获得特征信息对应的关联分析结果;对关联分析结果指示为非集合内信息的特征信息进行聚集异常分析,获得特征信息对应的聚集分析结果;将目标对象的特征信息以及各条特征信息对应的分析参数输入异常评分模型,以获得异常评分模型输出的异常评估分值,各条特征信息对应的分析参数包括内容分析结果、关联分析结果、聚集分析结果中的至少一种。本申请的能够得到准确的异常评估分值。常评估分值。常评估分值。

【技术实现步骤摘要】
数据处理方法及装置、电子设备、存储介质、程序产品


[0001]本申请涉及大数据领域,具体涉及一种数据处理方法及装置、电子设备、 计算机可读存储介质、以及计算机程序产品。

技术介绍

[0002]随着互联网和通信技术的快速发展,电子商务逐渐发展为与人们生活密 切相关的行业。商家在互联网上运营通常需要先注册商户账号,并在注册时 商户账号时提交商家的身份证明材料,由有关人员对这些身份证明材料进行 审核通过后,才允许商家通过商户账号在互联网上进行运营,并且在运营过 程中依赖于交易数据来识别商户账户的风险,但是这样无法做到风险的提前 发现,难以规避潜在损失。

技术实现思路

[0003]为解决上述技术问题,本申请的实施例提供了一种数据处理方法及装置、 电子设备、计算机可读存储介质以及计算机程序产品。
[0004]根据本申请实施例的一个方面,提供了一种数据处理方法,包括:根据预 设的内容异常判定规则对目标对象的特征信息进行内容分析,获得特征信息对 应的内容分析结果;根据预设的异常信息集合对内容分析结果指示内容正常的 特征信息进行关联分析,获得特征信息对应的关联分析结果;对关联分析结果 指示为非集合内信息的特征信息进行聚集异常分析,获得特征信息对应的聚集 分析结果;将所述目标对象的特征信息以及各条特征信息对应的分析参数输入 异常评估模型,以获得所述异常评估模型输出的异常评估分值,其中,各条特 征信息对应的分析参数包括所述内容分析结果、所述关联分析结果、所述聚集 分析结果中的至少一种。
[0005]根据本申请实施例的一个方面,提供了一种数据处理装置,包括:内容分 析模块,配置为根据预设的内容异常判定规则对目标对象的特征信息进行内容 分析,获得特征信息对应的内容分析结果;关联分析模块,配置为根据预设的 异常信息集合对内容分析结果指示内容正常的特征信息进行关联分析,获得特 征信息对应的关联分析结果;聚集分析模块,配置为对关联分析结果指示为非 集合内信息的特征信息进行聚集异常分析,获得特征信息对应的聚集分析结果; 异常评估模块,配置为将所述目标对象的特征信息以及各条特征信息对应的分 析参数输入异常评估模型,以获得所述异常评估模型输出的异常评估分值,其 中,各条特征信息对应的分析参数包括所述内容分析结果、所述关联分析结果、 所述聚集分析结果中的至少一种。
[0006]根据本申请实施例的一个方面,提供了一种电子设备,包括:一个或多 个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被 所述一个或多个处理器执行时,使得所述电子设备实现如前所述的数据处理 方法。
[0007]根据本申请实施例的一个方面,提供了一种计算机可读存储介质,其上 存储有计算机可读指令,当所述计算机可读指令被计算机的处理器执行时, 使计算机执行如上所述
的数据处理方法。
[0008]根据本申请实施例的一个方面,还提供了一种计算机程序产品,包括计 算机程序,该计算机程序被处理器执行时实现如上所述的数据处理方法。
[0009]在本申请的实施例所提供的技术方案中,一方面,由于得到异常评估分 值的过程都是基于对目标对象的特征信息的处理,若目标对象具体实现为商 户账号,目标对象的特征信息相应包括商户账号在注册时提交的身份证明材 料中的有关信息,根据这些特征信息即可以预先评估对应风险,不依赖于交 易数据,因此可以实现风险的提前发现,从而规避潜在风险;另一方面,基 于对目标对象的特征信息依次进行内容异常、关联异常和聚集异常三位一体 的分析,所得到的目标对象的各条特征信息对应的分析参数能够较为全面地 表征目标对象的异常程度,进而能够通过异常评估模型得到准确的异常评估 分值,若目标对象具体实现为商户账号,所得到的异常评估分值则能够准确 地反映商户账号的风险程度。
[0010]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性 的,并不能限制本申请。
附图说明
[0011]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申 请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描 述中的附图仅仅是本申请的一些实施例,对于本领域普通技术者来讲,在不 付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
[0012]图1是本申请涉及的一种实施环境的示意图;
[0013]图2是本申请的一示例性实施例示出的数据处理方法的流程图;
[0014]图3是图2所示实施例中的步骤S150在一个示例性实施例中的流程图;
[0015]图4是在图3所示实施例的基础上所提出的另一数据处理方法的流程图;
[0016]图5是图4所示实施例中的步骤S250在一个示例性实施例中的流程图;
[0017]图6是本申请的另一示例性实施例示出的数据处理方法的流程图;
[0018]图7是一示例性应用场景下的数据处理流程图;
[0019]图8是本申请的一示例性实施例示出的一种数据处理装置的框图;
[0020]图9示出了适于用来实现本申请实施例的电子设备的计算机系统的结构 示意图。
具体实施方式
[0021]这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的 描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的 要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所 有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一 些方面相一致的装置和方法的例子。
[0022]附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体 相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件 模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微 控制器装置中实现这些功能实体。
[0023]附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/ 步骤,
也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解, 而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际 情况改变。
[0024]在本申请中提及的“多个”是指两个或者两个以上。“和/或”描述关联对象 的关联关系,表示可以存在三种关系,例如,A和/或B可以表示:单独存在 A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对 象是一种“或”的关系。
[0025]在本申请的具体实施方式中,涉及到目标对象的特征信息等与用户相关 数据,当这些具体实施方式运用到具体产品或技术中时,需要获得用户许可 或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关 法律法规和标准。
[0026]如前所述的,商家在互联网上运营通常需要先注册商户账号,并在注册 时商户账号时提交商家的身份证明材料,例如工商信息(如商户注册地址、 统一社会信用代码或组织机构代码、法人证件号、收益所有人证件号等)、银 行账户信息、联系人信息(如商户联本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:根据预设的内容异常判定规则对目标对象的特征信息进行内容分析,获得特征信息对应的内容分析结果;根据预设的异常信息集合对内容分析结果指示内容正常的特征信息进行关联分析,获得特征信息对应的关联分析结果;对关联分析结果指示为非集合内信息的特征信息进行聚集异常分析,获得特征信息对应的聚集分析结果;将所述目标对象的特征信息以及各条特征信息对应的分析参数输入异常评估模型,以获得所述异常评估模型输出的异常评估分值,其中,各条特征信息对应的分析参数包括所述内容分析结果、所述关联分析结果、所述聚集分析结果中的至少一种。2.根据权利要求1所述的方法,其特征在于,所述对关联分析结果指示为非集合内信息的特征信息进行聚集异常分析,获得特征信息对应的聚集分析结果,包括:获取与所述关联分析结果指示为非集合内信息的特征信息相匹配的聚集异常阈值,并确定所述关联分析结果指示为非集合内信息的特征信息被其它对象所使用的次数;将所述次数和与所述聚集异常阈值进行数值大小对比,根据得到的对比结果确定特征信息对应的聚集分析结果。3.根据权利要求2所述的方法,其特征在于,在所述获取与所述关联分析结果指示为非集合内信息的特征信息相匹配的聚集异常阈值,并确定所述关联分析结果指示为非集合内信息的特征信息被其它对象所使用的次数之前,所述方法还包括:获取由多个样本对象的特征信息构成的信息样本集合;统计所述信息样本集合中含有的特征信息样本的聚集值,所述聚集值表征各特征信息样本在所述信息样本集合中出现的次数;根据所述特征信息样本的聚集值计算不同特征信息样本的聚集异常阈值。4.根据权利要求3所述的方法,其特征在于,所述获取由多个样本对象的特征信息构成的信息样本集合,包括:从数据库中随机获取多个样本对象的特征信息构成的信息样本集合,其中,所述数据库中存储的样本对象的特征信息按照预设周期进行更新,所述预设周期表征所述目标对象所在的场景体系下的异常变化周期。5.根据权利要求3所述的方法,其特征在于,所述根据所述特征信息样本的聚集值计算不同特征信息样本的聚集异常阈值,包括:对所述特征信息样本的聚集值进行分组,以得到多个聚集值组;对所述多个聚集值组分别进行抽样,以获得各个聚集值组中相应含有的抽样样本对象;确定各个聚集值组中抽样样本对象的异常占比,若所述异常占比大于或等于预设比值,则确定聚集值组中的最小聚集值为所述聚集值组所表征特征信息样本的聚集异常阈值。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:若同一特征信息样本对应多个最小聚集值,则将数值最低的最小聚集值作为所述特征信息样本的聚集异常阈值,或者将所述多个最小聚集值之间的平均值作为所述特征信息样
本的聚集异常阈值。7.根据权利要求5所述的方法,其特征在于,所述确定各个聚集值组中抽样样本对象的异常占比,若所述异常占比大于或等于预设比值,则确定聚集值组中的最小聚集值为所述聚集值组所表征特征信息样本的聚集异常阈值,包括:若所述异常占比大于或等于第一预设比值,确定所述抽样样本对象对应第一预警等级,将聚集值组中的最小聚集值作为所述第一预警等级对应的聚集异常阈值;若所述异常占比大于或等于第二预设比值且小于所述第一预设比值...

【专利技术属性】
技术研发人员:张宇康张洋
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1