准确获取离线数据的指标关系的方法、计算机设备、计算机可读存储介质技术

技术编号:38206746 阅读:9 留言:0更新日期:2023-07-21 16:54
本发明专利技术提供了一种准确获取离线数据的指标关系的方法,该方法包括:从离线数据集中获取历史数据;依据历史数据并应用特征融合和方差膨胀因子算法获取若干预训练模型,并输出若干预训练模型的运算式;获取增量数据,并将增量数据输入至所述若干预训练模型,以获取第一结果数据;将增量数据作为运算式的变量数值,并获取第二结果数据;判断第一结果数据是否等于第二结果数据;若第一结果数据不等于第二结果数据,获取第一结果数据和第二结果数据中的不同的异常数据;将所述异常数据关联的预训练模型推送至专家以供专家进行修正;接收修正结果,并再将增量数据输入至未修正的异常数据关联的预训练模型中。本发明专利技术提高了工作效率。本发明专利技术提高了工作效率。本发明专利技术提高了工作效率。

【技术实现步骤摘要】
准确获取离线数据的指标关系的方法、计算机设备、计算机可读存储介质


[0001]本专利技术涉及金融科技
,尤其涉及一种准确获取离线数据的指标关系的方法、计算机可读存储介质、计算机设备。

技术介绍

[0002]随着业务的不断发展,规模不断扩大,数据呈爆发式增长,数据关系日趋复杂,数据价值不容易被挖掘,如何让数据分析、数据开发、数据产品经理等数据使用人员在海量数据中轻松发现数据的指标之间的关系;同时快速定位数据异常值和检测异常值,实现科技赋能下业务高质量发展,显得尤为重要,现有的离线大数据管理平台已经解决了大部分业务数据指标关系的梳理和呈现,以及基于简单规则配置的异常数据监控,但是传统的指标关系维护依旧主要依靠业务人员手工处理,存在维护不及时、过分依赖业务经验、异常检测不及时等明显的弊端,需要加以改进。

技术实现思路

[0003]有鉴于此,实有必要提供一种可提高工作效率的准确获取离线数据的指标关系的方法、计算机存储介质、计算机设备。
[0004]第一方面,本申请提供了一种准确获取离线数据的指标关系的方法,所述方法包括:从离线数据集中获取历史数据;依据所述历史数据并应用特征融合和方差膨胀因子算法获取若干预训练模型,并输出所述若干预训练模型的运算式,所述运算式包括多个运算式;获取增量数据,并将所述增量数据输入至所述若干预训练模型,以获取第一结果数据;将所述增量数据作为所述运算式的变量数值,并获取第二结果数据;判断所述第一结果数据是否等于所述第二结果数据;若所述第一结果数据不等于所述第二结果数据,获取所述第一结果数据和所述第二结果数据中的不同的异常数据,并将所述异常数据在离线大数据管理平台显示。将所述异常数据关联的预训练模型推送至专家以供专家进行修正;接收所述修正结果,并再将所述增量数据输入至未修正的所述异常数据关联的预训练模型中。
[0005]第二方面,本申请提供了一种准确获取离线数据的指标关系的的计算机设备,所述计算机设备包括存储器和处理器。存储器,用于存储计算机程序指令。处理器,用于执行所述计算机程序指令以实现所述的准确获取离线数据的指标关系的方法。
[0006]第三方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序指令,所述程序指令可被处理器执行以实现所述准确获取离线数据的指标关系的方法。
[0007]本申请中,先利用历史数据并应用特征融合算法和方差膨胀因子获取预训练模型并输出预训练模型的运算式,再将当前日期的增量数据输入至模型中以获取第一结果,将所述增量数据作为运算式的自变量以获取第二结果,若所述第一结果与所述第二结果不相等,获取不同的异常数据并显示在大数据平台上以供专家进行评分和修正所述异常数据关
联的预训练模型。若模型未修正,再将增量数据输入至模型中并获取结果,以再次供专家进行评分和修正。本方案还增加了预警配置,当所述异常数据为预警条件时,以邮件或短信的形式告知工作人员。大大减少指标维护人员的工作量,减少数据探查对业务经验的依赖,加快数据使用者对数据和业务的理解速度,数据消费方可以自由扩展和应用,充分发挥数据价值,助力业务可快速发现和定位数据异常,在海量数据中轻松挖掘数据指标之间的关系,提高工作效率。
附图说明
[0008]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
[0009]图1为本申请实施例提供的一种准确获取离线数据的指标关系的的系统的架构示意图。
[0010]图2为本申请实施例提供的一种准确获取离线数据的指标关系的方法的流程示意图。
[0011]图3为本申请实施例提供的以图谱的形式展示的预训练模型的运算式的示意图。
[0012]图4为本申请实施例提供的一种准确获取离线数据的指标关系的的服务器的内部结构示意图。
具体实施方式
[0013]下面将结合本专利技术实施例中附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0014]本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,换句话说,描述的实施例根据除了这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,还可以包含其他内容,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于只清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0015]需要说明的是,在本申请中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者多个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本申请
要求的保护范围之内。
[0016]本申请提供了一种准确获取离线数据的指标关系的方法,所述方法运行于如图1所示的准确获取离线数据的指标关系的系统。所述系统由业务端1和服务器端2组成。业务端1用来显示大数据管理平台页面以供工作人员进行浏览和操作。所述服务器端2中存储有离线数据集,从离线数据集中获取离线数据并进行处理,将处理结果显示在业务端1并接收工作人员在业务端1的操作并处理,将处理结果返回至业务端1。所述业务端1和服务器2通过网络3进行通信。其中,服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。所述应用端1可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。
[0017]请参看图2,图2为本申请实施例提供的一种准确获取离线数据的指标关系的方法的流程示意图。包括步骤S101

步骤S107。
[0018]步骤S101,从离线数据集中获取历史数据,依据所述历史数据并应用特征融合和方差膨胀因子算法获取若干预训练模型,并输出所述若干预训练模型的运算式,所述运算式包括多个运算式。
[0019]离线数据一般是指当前处理的数据的截止日期为前一天,只能够处理前一天的数据,例如今天的日期T=本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种准确获取离线数据的指标关系的方法,其特征在于,所述方法包括:从离线数据集中获取历史数据,依据所述历史数据并应用特征融合和方差膨胀因子算法获取若干预训练模型,并输出所述若干预训练模型的运算式,所述运算式包括多个运算式;获取增量数据,并将所述增量数据输入至所述若干预训练模型,以获取第一结果数据;将所述增量数据作为所述运算式的变量数值,并获取第二结果数据;判断所述第一结果数据是否等于所述第二结果数据;若所述第一结果数据不等于所述第二结果数据,获取所述第一结果数据和所述第二结果数据中的不同的异常数据,并将所述异常数据在离线大数据管理平台显示。将所述异常数据关联的预训练模型推送至专家以供专家进行修正;接收所述修正结果,并再将所述增量数据输入至未修正的所述异常数据关联的预训练模型中以获取结果数据。2.如权利要求1所述的准确获取离线数据的指标关系的方法,其特征在于,所述方法还包括:将所述预训练模型的运算式以图谱的形式在所述离线大数据管理平台显示,并将所述预训练模型推送至专家以供专家进行评分。3.如权利要求1所述的准确获取离线数据的指标关系的方法,其特征在于,所述方法还包括:当所述异常数据对应的运算式为预设预警监控条件,自动发送信息以告知工作人员。4.如权利要求1所述的准确获取离线数据的指标关系的方法,其特征在于,所述方法包括:判断所述预训练模型的运算式是否为数值型运算式;若所述运算式是数值...

【专利技术属性】
技术研发人员:农春玲
申请(专利权)人:平安银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1