一种数据处理方法、装置及设备制造方法及图纸

技术编号:36356077 阅读:56 留言:0更新日期:2023-01-14 18:12
本说明书实施例公开了一种数据处理方法、装置及设备,该方法包括:获取目标用户执行目标业务时产生的目标数据,目标数据中包括结构化数据和/或非结构化数据,非结构化数据中包括文本数据、图像数据和时序数据中的一种或多种;将目标数据转换为标记序列,并根据目标数据中包含的数据内容和标记序列的对应关系,为标记序列中的每个标记信息设置相应的位置,根据目标数据中包含的数据类型的不同,为标记序列设置相应的数据分块信息;将标记序列、设置的相应位置和设置的相应数据分块信息输入到预设的编码模型中,得到标记序列中的每个标记信息对应的编码信息;基于标记序列中的每个标记信息对应的编码信息进行相应的业务处理。记信息对应的编码信息进行相应的业务处理。记信息对应的编码信息进行相应的业务处理。

【技术实现步骤摘要】
一种数据处理方法、装置及设备


[0001]本文件涉及计算机
,尤其涉及一种数据处理方法、装置及设备。

技术介绍

[0002]在对用户的非法金融活动进行解限或其他风险识别领域中,需要对用户是否存在风险进行识别,通常是将用户的交易或身份等信息清洗成velocity特征进行模型训练,得到相应的模型,然后,可以通过该模型判断是否进行解限或进行识别等,但是,除了上述数据的特征外,用户还有很多其他的特征,例如,操作行为时序特征、提供的图像类的凭证、以及文本信息等,而这些特征也是进行上述风险识别的重要信息,可以提高通过模型进行风险识别的准确率,然而,如何将上述信息和基础的velocity特征进行融合进而对模型训练,从而提高风险识别的准确率成为需要解决的重要问题。为此,需要提供一种融合了结构化数据和非结构化数据的多模态风险信息统一建模框架,进而可以很好的解决上述问题,以提高识别风险的准确率和覆盖率。

技术实现思路

[0003]本说明书实施例的目的是提供一种融合了结构化数据和非结构化数据的多模态风险信息统一建模框架,进而可以很好的解决上述问本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,所述方法包括:获取目标用户执行目标业务时产生的目标数据,所述目标数据中包括结构化数据和/或非结构化数据,所述非结构化数据中包括文本数据、图像数据和时序数据中的一种或多种;将所述目标数据转换为标记序列,并根据所述目标数据中包含的数据内容和所述标记序列的对应关系,为所述标记序列中的每个标记信息设置相应的位置,根据所述目标数据中包含的数据类型的不同,为所述标记序列设置相应的数据分块信息;将所述标记序列、所述标记序列中的每个标记信息设置的相应位置和所述标记序列设置的相应数据分块信息输入到预设的编码模型中,得到所述标记序列中的每个标记信息对应的编码信息;基于所述标记序列中的每个标记信息对应的编码信息进行相应的业务处理。2.根据权利要求1所述的方法,所述目标数据中包括结构化数据,所述将所述目标数据转换为标记序列,并根据所述目标数据中包含的数据内容和所述标记序列的对应关系,为所述标记序列中的每个标记信息设置相应的位置,根据所述目标数据中包含的数据类型的不同,为所述标记序列设置相应的数据分块信息,包括:将所述目标数据转换为时序数据结构形式的第一数据,所述第一数据中包括所述目标用户的结构化特征和每个结构化特征对应的编码信息;基于所述第一数据中的结构化特征确定所述目标数据对应的标记序列,并基于每个结构化特征对应的编码信息确定所述标记序列中的每个标记信息设置的相应位置,基于所述结构化数据对应的数据类型,为所述标记序列设置相应的数据分块信息。3.根据权利要求1所述的方法,所述目标数据中包括非结构化数据,所述非结构化数据中包括文本数据,所述将所述目标数据转换为标记序列,并根据所述目标数据中包含的数据内容和所述标记序列的对应关系,为所述标记序列中的每个标记信息设置相应的位置,根据所述目标数据中包含的数据类型的不同,为所述标记序列设置相应的数据分块信息,包括:基于所述目标数据中的文本数据中包含的字符确定所述目标数据对应的标记信息,并基于所述文本数据中字符排列的顺序确定所述目标数据对应的标记序列,基于所述文本数据中字符排列的顺序,为所述标记序列中的每个标记信息设置相应的位置,基于所述文本数据对应的数据类型,为所述标记序列设置相应的数据分块信息。4.根据权利要求1所述的方法,所述目标数据中包括非结构化数据,所述非结构化数据中包括图像数据,所述将所述目标数据转换为标记序列,并根据所述目标数据中包含的数据内容和所述标记序列的对应关系,为所述标记序列中的每个标记信息设置相应的位置,根据所述目标数据中包含的数据类型的不同,为所述标记序列设置相应的数据分块信息,包括:将所述目标数据中的图像数据划分为多个不同的图像块,基于每个图像块确定所述目标数据对应的标记信息,并基于多个不同的图像块在所述图像数据中的排列顺序确定所述目标数据对应的标记序列,基于多个不同的图像块在所述图像数据中的排列顺序,为所述标记序列中的每个标记信息设置相应的位置,基于所述图像数据对应的数据类型,为所述标记序列设置相应的数据分块信息。
5.根据权利要求1所述的方法,所述目标数据中包括非结构化数据,所述非结构化数据中包括时序数据,所述将所述目标数据转换为标记序列,并根据所述目标数据中包含的数据内容和所述标记序列的对应关系,为所述标记序列中的每个标记信息设置相应的位置,根据所述目标数据中包含的数据类型的不同,为所述标记序列设置相应的数据分块信息,包括:将所述目标数据中的时序数据中的不同时间对应的数据内容转换为标记序列,并根据所述时序数据中包含的不同时间对应的数据内容与所述标记序列的对应关系,以及所述时序数据中包含的时间及其相应的数据内容,为所述标记序列中的每个标记信息设置相应的位置,基于所述时序数据对应的数据类型,为所述标记序列设置相应的数据分块信息。6.根据权利要求5所述的方法,所述获取目标用户执行目标业务时产生的目标数据,包括:获取所述目标用户多次执行目标...

【专利技术属性】
技术研发人员:李怀松宋博文张天翼靳如一成鹏侯辉超
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1