数据处理方法、装置及设备制造方法及图纸

技术编号:37442993 阅读:20 留言:0更新日期:2023-05-06 09:14
本说明书实施例提供了一种数据处理方法、装置及设备,其中,该方法包括:获取待检测的目标数据,并基于所述目标数据构建语法树;基于所述语法树以及所述目标数据中每个符号所在的作用域之间的关系,确定所述目标数据中每个符号对应的目标信息,所述目标信息包括所述每个符号所在作用域的访问路径;基于所述目标数据中每个符号对应的目标信息,确定所述目标数据中任意两个符号之间的目标距离,并基于所述目标距离,对所述目标数据中的任意两个符号进行配对处理,得到配对成功的符号对;基于与所述符号对中的符号对应的有效性验证方式,对所述符号对中的符号进行有效性验证。述符号对中的符号进行有效性验证。述符号对中的符号进行有效性验证。

【技术实现步骤摘要】
数据处理方法、装置及设备


[0001]本文件涉及数据处理
,尤其涉及一种数据处理方法、装置及设备。

技术介绍

[0002]随着计算机技术的快速发展,企业为用户提供的应用服务的种类和数量也越来越多,随之而来的用户数据的数据量日益增加,数据结构也日趋复杂,这就导致数据检测的复杂度较高。
[0003]以通过代码数据进行账户有效性验证为例,人工需要从代码数据中查找到用户账号和对应的密码数据,在通过人工对用户账号和密码数据进行有效性验证。但是,由于待检测数据的数据量较大,且包含较多的账户和密码数据,所以,通过人工进行筛选配对以及账号有效性验证的方式,就会导致验证效率和准确性低,因此,需要一种能够提高对账号进行有效性验证的效率和准确性的解决方案。

技术实现思路

[0004]本说明书实施例的目的是提供一种数据处理方法、装置及设备,以提供一种能够提高对账号进行有效性验证的效率和准确性的解决方案。
[0005]为了实现上述技术方案,本说明书实施例是这样实现的:
[0006]第一方面,一种数据处理方法,包括:获取待检测本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,包括:获取待检测的目标数据,并基于所述目标数据构建语法树;基于所述语法树以及所述目标数据中每个符号所在的作用域之间的关系,确定所述目标数据中每个符号对应的目标信息,所述目标信息包括所述每个符号所在作用域的访问路径;基于所述目标数据中每个符号对应的目标信息,确定所述目标数据中任意两个符号之间的目标距离,并基于所述目标距离,对所述目标数据中的任意两个符号进行配对处理,得到配对成功的符号对;基于与所述符号对中的符号对应的有效性验证方式,对所述符号对中的符号进行有效性验证。2.根据权利要求1所述的方法,所述基于所述目标数据中每个符号对应的目标信息,确定所述目标数据中任意两个符号之间的目标距离,并基于所述目标距离,对所述目标数据中的任意两个符号进行配对处理,得到配对成功的符号对,包括:基于预设账号关键词,对所述目标数据中每个符号进行过滤处理,得到与所述预设账号关键词对应的第一符号表;基于预设可验证信息关键词,对所述目标数据中每个符号进行过滤处理,得到与所述预设可验证信息关键词对应的第二符号表;基于所述第一符号表中每个符号对应的目标信息以及所述第二符号表中每个符号对应的目标信息,确定所述第一符号表中任意一个符号与所述第二符号表中任意一个符号之间的目标距离,并基于所述目标距离,对所述第一符号表中的符号与所述第二符号表中的符号进行配对处理,得到配对成功的所述符号对。3.根据权利要求2所述的方法,所述目标距离基于任意两个符号在所述目标数据中的文本距离、所述两个符号的相似性距离以及由所述目标信息确定的两个符号之间的可达距离确定。4.根据权利要求3所述的方法,所述基于所述第一符号表中每个符号对应的目标信息以及所述第二符号表中每个符号对应的目标信息,确定所述第一符号表中任意一个符号与所述第二符号表中任意一个符号之间的目标距离,包括:确定第一符号和第二符号之间的相似性距离,所述第一符号为所述第一符号表中的任意一个符号,所述第二符号为所述第二符号表中的任意一个符号;在基于所述目标信息确定所述第一符号与所述第二符号在同一作用域的情况下,基于所述目标数据,确定所述第一符号和所述第二符号在所述目标数据中的文本距离,并基于所述文本距离和所述相似性距离,确定所述第一符号和所述第二符号之间的目标距离;在基于所述目标信息确定所述第一符号与所述第二符号在不同作用域的情况下,基于所述第一符号对应的目标信息以及所述第二符号对应的目标信息,确定所述第一符号和所述第二符号之间的可达距离,并基于所述可达距离和所述相似性距离,确定所述第一符号和所述第二符号之间的目标距离。5.根据权利要求4所述的方法,所述目标信息还包括所述每个符号的可访问信息,所述基于所述第一符号对应的目标信息以及所述第二符号对应的目标信息,确定所述第一符号和所述第二符号之间的可达距离,包括:
在基于所述第一符号的可访问信息以及所述第二符号的可访问信息,确定所述第一符号和所述第二符号为可访问的情况下,基于所述第一符号所在作用域的访问路径和所述第二符号所在作用域的访问路径,确定所述第一符号和所述第二符号之间的可达距离。6.根据权利要求4所述的方法,所述基于所述目标数据,确定所述第一符号和所述第二符号在所述目标数据中的文本距离,包括:获取文本距离确定算法中与所述目标数据的数据类型对应的目标文本距离确定算法,所述文本距离确定算法包括与编程语言类型对应的位置衰减算法、与配置语言类型对应的线性距离确定算法;基于所述目标文本距离确定算法、所述第一符号在所述目标数据中的位置信息以及所述第二符号在所述目标数据中的位置信息,确定所述第一符号和所述第二符号在所述目标数据中的文本距离...

【专利技术属性】
技术研发人员:李丰廷郝新刘焱
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1