数据查找工具识别方法、装置、设备和存储介质制造方法及图纸

技术编号:39002898 阅读:8 留言:0更新日期:2023-10-07 10:34
本申请涉及一种数据查找工具识别方法和装置,涉及大数据技术领域。所述方法包括:获取针对于金融数据库待识别的数据查找工具对应的查找记录,并获取查找记录包含的多个查找记录项目分别对应的项目值;根据项目值,获取各查找记录项目分别对应的异常状态值;基于异常状态值,获取预先得到的各查找记录项目分别对应的第一子概率和第二子概率;根据各第一子概率,获取数据查找工具为目标数据查找工具的第一概率,以及根据各第二子概率,获取数据查找工具不是目标数据查找工具的第二概率;根据第一概率与第二概率的大小关系,识别数据查找工具是否为目标数据查找工具。采用本方法能够高效识别出数据查找工具是否为查找效率低下的目标数据查找工具。目标数据查找工具。目标数据查找工具。

【技术实现步骤摘要】
数据查找工具识别方法、装置、设备和存储介质


[0001]本申请涉及大数据
,特别是涉及一种数据查找工具识别方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]随着大数据
的发展,出现了金融数据库数据查找技术,该技术通过金融数据库对应的数据查找工具,从金融数据库查找到目标数据。
[0003]在上述技术方案中,随着金融业务变化,业务数据量增加的方式发生变化,会导致部分数据查找工具查找效率下降的问题,因此需要对低效率的数据查找工具进行人工排查,然而通过人工识别低效率的数据查找工具会耗费大量的人力物力,使得低效率的数据查找工具识别效率低下。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够高效识别数据查找工具是否为查找效率低下的目标数据查找工具的数据查找工具识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种数据查找工具识别方法。所述方法包括:
[0006]获取针对于金融数据库待识别的数据查找工具对应的查找记录,并获取所述查找记录包含的多个查找记录项目分别对应的项目值;
[0007]根据所述项目值,获取各所述查找记录项目分别对应的异常状态值;所述异常状态值表征各所述查找记录项目是否为异常状态;
[0008]基于所述异常状态值,获取预先得到的各所述查找记录项目分别对应的第一子概率和第二子概率;所述第一子概率表征所述数据查找工具为目标数据查找工具的情况下,各所述查找记录项目为所述异常状态值下的概率,所述第二子概率表征所述数据查找工具不是所述目标数据查找工具的情况下,各所述查找记录项目为所述异常状态值下的概率;所述目标数据查找工具表征查找效率低于预设查找效率值的数据查找工具;
[0009]根据各所述第一子概率,获取所述数据查找工具为所述目标数据查找工具的第一概率,以及根据各所述第二子概率,获取所述数据查找工具不是所述目标数据查找工具的第二概率;
[0010]根据所述第一概率与所述第二概率的大小关系,识别所述数据查找工具是否为所述目标数据查找工具。
[0011]在其中一个实施例中,所述获取针对于金融数据库待识别的数据查找工具对应的查找记录之前,还包括:获取针对于所述金融数据库的多个历史数据查找工具分别对应的历史查找记录,以及各所述历史查找记录包含的多个查找记录项目分别对应的历史项目值,并基于各所述历史项目值,得到各所述查找记录项目对应的历史异常状态值;基于各所述历史查找记录,得到所述历史数据查找工具为所述目标数据查找工具的第一数量,以及
所述历史数据查找工具不是所述目标数据查找工具的第二数量;根据所述第一数量、所述第二数量以及各所述查找记录项目对应的历史异常状态值,得到各所述查找记录项目分别对应的第一子概率和第二子概率。
[0012]在其中一个实施例中,所述根据所述第一数量、所述第二数量以及各所述查找记录项目对应的历史异常状态值,得到各所述查找记录项目分别对应的第一子概率和第二子概率,包括:获取所述历史数据查找工具为所述目标数据查找工具的情况下,所述历史数据查找工具对应的当前查找记录项目的当前历史异常状态值的第一异常状态值数量,以及获取所述历史数据查找工具不是所述目标数据查找工具的情况下,所述当前历史异常状态值的第二异常状态值数量;将第一异常状态值数量与所述第一数量的比值作为所述当前查找记录项目对应的第一子概率;将第二异常状态值数量与所述第二数量的比值作为所述当前查找记录项目对应的第二子概率。
[0013]在其中一个实施例中,所述根据各所述第一子概率,获取所述数据查找工具为所述目标数据查找工具的第一概率,以及根据各所述第二子概率,获取所述数据查找工具不是所述目标数据查找工具的第二概率,包括:基于各所述第一子概率,以及所述第一数量与所述历史数据查找工具总数量的第一比值,得到所述数据查找工具为所述目标数据查找工具的第一概率;基于各所述第二子概率,以及所述第二数量与所述历史数据查找工具总数量的第二比值,得到所述数据查找工具不是所述目标数据查找工具的第二概率。
[0014]在其中一个实施例中,所述基于各所述历史项目值,得到各所述查找记录项目对应的历史异常状态值,包括:获取各所述历史数据查找工具对应于当前查找记录项目的历史项目值;将历史项目值进行划分,得到所述当前查找记录项目对应的两个历史项目值集合;获取各所述历史项目值集合中的历史项目值的平均值;基于所述平均值,得到各所述历史项目值集合对应的集合异常状态值,并将所述集合异常状态值作为各所述历史项目值集合中各个历史项目值对应的历史异常状态值。
[0015]在其中一个实施例中,所述将历史项目值进行划分,得到所述当前查找记录项目对应的两个历史项目值集合,包括:从所述历史项目值中,任意选取两个历史项目值作为初始聚类中心;获取各所述历史项目值分别到所述初始聚类中心的距离信息,并基于所述距离信息,将各所述历史项目值划分两个初始历史项目值集合;基于各所述初始历史项目值集合中的历史项目值,得到各所述初始历史项目值集合对应的聚类中心;将所述聚类中心作为初始聚类中心,重复获取各所述历史项目值分别到所述初始聚类中心的距离信息的步骤,直到所述初始聚类中心和所述聚类中心相同,将所述初始历史项目值集合作为所述当前查找记录项目对应的历史项目值集合。
[0016]在其中一个实施例中,所述基于所述平均值,得到各所述历史项目值集合对应的集合异常状态值之后,还包括:获取所述两个历史项目值集合分别对应的两个聚类中心;基于所述集合异常状态值,将所述两个聚类中心划分为目标聚类中心和非目标聚类中心;所述目标聚类中心为集合异常状态值为异常状态的历史项目值集合的聚类中心。
[0017]在其中一个实施例中,所述根据所述项目值,获取各所述查找记录项目分别对应的异常状态值,包括:获取当前查找记录项目对应的项目值与所述目标聚类中心的第一距离,以及所述当前查找记录项目对应的项目值与所述非目标聚类中心的第二距离;若所述第一距离大于所述第二距离,则所述当前查找记录项目对应的异常状态值表征所述当前查
找记录项目为异常状态;若所述第一距离小于或等于所述第二距离,则所述当前查找记录项目对应的异常状态值表征所述当前查找记录项目为正常状态。
[0018]在其中一个实施例中,当前查找记录项目缺失一个或多个历史项目值;所述根据所述第一数量、所述第二数量以及各所述查找记录项目对应的历史异常状态值,得到各所述查找记录项目分别对应的第一子概率和第二子概率,包括:获取所述当前查找记录项目对应的历史异常状态值的初始数量,并将所述初始数量加上预设数量,得到所述初始数量对应的目标数量;基于所述第一数量、所述第二数量以及所述目标数量,得到当前查找记录项目对应的第一子概率以及第二子概率。
[0019]在其中一个实施例中,所述根据所述第一概率与所述第二概率的大小关系,识别所述数据查找工具是否为所述目标数据查找工具,包括:若所述第一概率大于所述第二概率,则所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据查找工具识别方法,其特征在于,所述方法包括:获取针对于金融数据库待识别的数据查找工具对应的查找记录,并获取所述查找记录包含的多个查找记录项目分别对应的项目值;根据所述项目值,获取各所述查找记录项目分别对应的异常状态值;所述异常状态值表征各所述查找记录项目是否为异常状态;基于所述异常状态值,获取预先得到的各所述查找记录项目分别对应的第一子概率和第二子概率;所述第一子概率表征所述数据查找工具为目标数据查找工具的情况下,各所述查找记录项目为所述异常状态值下的概率,所述第二子概率表征所述数据查找工具不是所述目标数据查找工具的情况下,各所述查找记录项目为所述异常状态值下的概率;所述目标数据查找工具表征查找效率低于预设查找效率值的数据查找工具;根据各所述第一子概率,获取所述数据查找工具为所述目标数据查找工具的第一概率,以及根据各所述第二子概率,获取所述数据查找工具不是所述目标数据查找工具的第二概率;根据所述第一概率与所述第二概率的大小关系,识别所述数据查找工具是否为所述目标数据查找工具。2.根据权利要求1所述的方法,其特征在于,所述获取针对于金融数据库待识别的数据查找工具对应的查找记录之前,还包括:获取针对于所述金融数据库的多个历史数据查找工具分别对应的历史查找记录,以及各所述历史查找记录包含的多个查找记录项目分别对应的历史项目值,并基于各所述历史项目值,得到各所述查找记录项目对应的历史异常状态值;基于各所述历史查找记录,得到所述历史数据查找工具为所述目标数据查找工具的第一数量,以及所述历史数据查找工具不是所述目标数据查找工具的第二数量;根据所述第一数量、所述第二数量以及各所述查找记录项目对应的历史异常状态值,得到各所述查找记录项目分别对应的第一子概率和第二子概率。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一数量、所述第二数量以及各所述查找记录项目对应的历史异常状态值,得到各所述查找记录项目分别对应的第一子概率和第二子概率,包括:获取所述历史数据查找工具为所述目标数据查找工具的情况下,所述历史数据查找工具对应的当前查找记录项目的当前历史异常状态值的第一异常状态值数量,以及获取所述历史数据查找工具不是所述目标数据查找工具的情况下,所述当前历史异常状态值的第二异常状态值数量;将第一异常状态值数量与所述第一数量的比值作为所述当前查找记录项目对应的第一子概率;将第二异常状态值数量与所述第二数量的比值作为所述当前查找记录项目对应的第二子概率。4.根据权利要求2所述的方法,其特征在于,所述根据各所述第一子概率,获取所述数据查找工具为所述目标数据查找工具的第一概率,以及根据各所述第二子概率,获取所述数据查找工具不是所述目标数据查找工具的第二概率,包括:基于各所述第一子概率,以及所述第一数量与所述历史数据查找工具总数量的第一比
值,得到所述数据查找工具为所述目标数据查找工具的第一概率;基于各所述第二子概率,以及所述第二数量与所述历史数据查找工具总数量的第二比值,得到所述数据查找工具不是所述目标数据查找工具的第二概率。5.根据权利要求2所述的方法,其特征在于,所述基于各所述历史项目值,得到各所述查找记录项目对应的历史异常状态值,包括:获取各所述历史数据查找工具对应于当前查找记录项目的历史项目值;将历史项目值进行划分,得到所述当前查找记录项目对应的两个历史项目值集合;获取各所述历史项目值集合中的历史项目值的平均值;基于所述平均值,得到各所述历史项目值集合对应的集合异常状态值,并将所述集合异常状态值作为各所述历史项目值集合中各个历史项目值对应的历史异常状态值。6.根据权利要求5所述的方法,其特征在于,所述将历史项目值进行划分,得到所述当前查找记录项目对应的两个历史项目值集合,包括:从所述历史项目值中,任意选取两个历史项目值作为初始聚类中心;获取各所述历史项目值分别到所述初始聚类中心的距离信息,并基于所述距离信息,将各所述历史项目值划分两个初始历史项目值集合;基于各所述初始历史项目值集合中的历史项目值,得到各所述初始历史项目值集合对应的聚类中心;将所述聚类中心作为初始聚类中心,重复获取各所述历史项目值...

【专利技术属性】
技术研发人员:王燕丽张彬郑显凌李志兴
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1