数据溯源分析方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:34250923 阅读:67 留言:0更新日期:2022-07-24 11:31
本申请涉及人工智能技术领域,揭露了一种数据溯源分析方法、装置、计算机设备及存储介质,所述方法包括:获取待处理数据;通过利用提取模型对所述待处理数据中的保单数据进行特征提取,得到标准化数据;利用溯源模型,根据所述标准化数据对所述待处理数据中的资源数据进行溯源,得到明细报表;根据第一预设条件对所述明细报表中的数据进行整合,得到目标报表。本申请还涉及区块链技术,所述明细报表和目标报表存储于区块链中。本申请实现了快速且清晰的对所述资源数据进行溯源。清晰的对所述资源数据进行溯源。清晰的对所述资源数据进行溯源。

Data traceability analysis method, device, computer equipment and storage medium

【技术实现步骤摘要】
数据溯源分析方法、装置、计算机设备及存储介质


[0001]本申请涉及人工智能领域,尤其涉及一种数据溯源分析方法、装置、计算机设备及存储介质。

技术介绍

[0002]目前各大型公司都会销售各种各样的产品,超几十种,甚至上百种的产品,并且在产品销售上还会存在捆绑销售等场景,而销售产品的费用往往都是按主产品或公司汇总结算。这样我们很难直接得到各产品的利润情况。目前,数据分摊的工作主要交由计算机来执行,主要是采用ocacle的PL/SQL进行处理和查看。但随着原始数据的不断细化,采用ocacle的PL/SQL仅能机械的查看某一类或某一项,且随着原始数据的不断增多,采用ocacle的PL/SQL进行处理和查看的速度越来越慢,因此,如何快速且清晰的对所述数据进行溯源成为了亟待解决的问题。

技术实现思路

[0003]本申请提供了一种数据溯源分析方法、装置、计算机设备及存储介质,以解决现有技术中,如何快速且清晰的对数据进行溯源的问题。
[0004]为解决上述问题,本申请提供了一种数据溯源分析方法,包括:
[0005]获取待处理数据;
[0006]通过利用提取模型对所述待处理数据中的保单数据进行特征提取,得到标准化数据;
[0007]利用溯源模型,根据所述标准化数据对所述待处理数据中的资源数据进行溯源,得到明细报表;
[0008]根据第一预设条件对所述明细报表中的数据进行整合,得到目标报表。
[0009]进一步的,在所述通过利用提取模型对所述待处理数据中的保单数据进行特征提取之前,还包括:
[0010]利用第二预设条件来识别所述保单数据中的异常值,提取所述异常值所处位置的文本数据;
[0011]通过语义识别模型对所述文本数据进行语义提取,得到提取结果;
[0012]利用所述提取结果对所述异常值进行纠正。
[0013]进一步的,所述通过利用提取模型对所述待处理数据中的保单数据进行特征提取包括:
[0014]通过所述提取模型中预设的正则表达式来对所述保单数据进行特征提取,得到标准化数据。
[0015]进一步的,所述通过利用提取模型对所述待处理数据中的保单数据进行特征提取,得到标准化数据包括:
[0016]将所述保单数据中的各段落文本分别输入提取模型进行特征提取,得到各段落对
应的关键数据,所述提取模型基于LDA模型训练得到;
[0017]将所述保单数据中各段落对应的关键数据进行组合,得到所述标准化数据。
[0018]进一步的,在所述通过利用提取模型对所述待处理数据中的保单数据进行特征提取,得到标准化数据之后,还包括:
[0019]基于所述标准化数据中各数据的数据类型,获取所述数据对应的标准数据类型;
[0020]将数据对应的数据类型和标准数据类型进行比对,判断是否一致;
[0021]若不一致,则利用转换算法对所述数据进行转换处理。
[0022]进一步的,所述利用溯源模型,根据所述标准化数据对所述待处理数据中的资源数据进行溯源包括:
[0023]基于所述溯源模型,利用所述标准化数据对所述资源数据进行多维度的溯源,实现将所述资源数据进行细分。
[0024]进一步的,所述根据第一预设条件对所述明细报表中的数据进行整合包括:
[0025]接收前端的执行指令;
[0026]根据所述执行指令,提取对应的所述第一预设条件;
[0027]根据所述第一预设条件对所述明细报表中的数据进行整合。
[0028]为了解决上述问题,本申请还提供一种数据溯源分析装置,所述装置包括:
[0029]获取模块,用于获取待处理数据;
[0030]提取模块,用于通过利用提取模型对所述待处理数据中的保单数据进行特征提取,得到标准化数据;
[0031]溯源模块,用于利用溯源模型,根据所述标准化数据对所述待处理数据中的资源数据进行溯源,得到明细报表;
[0032]整合模块,用于根据第一预设条件对所述明细报表中的数据进行整合,得到目标报表。
[0033]为了解决上述问题,本申请还提供一种计算机设备,包括:
[0034]至少一个处理器;以及,
[0035]与所述至少一个处理器通信连接的存储器;其中,
[0036]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的数据溯源分析方法。
[0037]为了解决上述问题,本申请还提供一种非易失性的计算机可读存储介质,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如上所述的数据溯源分析方法。
[0038]根据本申请实施例提供的一种数据溯源分析方法、装置、计算机设备及存储介质,与现有技术相比至少具有以下有益效果:
[0039]通过获取待处理数据,利用提取模型对所述待处理数据中的保单数据进行特征提取,得到标准化数据,以便于提高后续处理步骤的效率,再利用溯源模型,根据所述标准化数据对所述待处理数据中的资源数据进行溯源,得到明细报表,以得到所述资源数据的多个维度的细化数据,最后根据第一预设条件对所述明细报表中的数据进行整合,得到目标报表,实现根据需要对细化数据进行组合,得到目标报表,实现了快速且清晰的对所述资源数据进行溯源。
附图说明
[0040]为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图做一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0041]图1为本申请一实施例提供的数据溯源分析方法的流程示意图;
[0042]图2为图1中步骤S2的一种具体实施方式的流程图;
[0043]图3为本申请一实施例提供的数据溯源分析装置的模块示意图;
[0044]图4为本申请一实施例的计算机设备的结构示意图。
具体实施方式
[0045]除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”“第二”等是用于区别不同对象,而不是用于描述特定顺序。
[0046]在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是是相同的实施例,也不是与其它实施例相互排斥的独立的或备选的实施例。本领域技术人员显式地或隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
[0047]本申请提供一种数据溯源分析方法。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据溯源分析方法,其特征在于,所述方法包括:获取待处理数据;通过利用提取模型对所述待处理数据中的保单数据进行特征提取,得到标准化数据;利用溯源模型,根据所述标准化数据对所述待处理数据中的资源数据进行溯源,得到明细报表;根据第一预设条件对所述明细报表中的数据进行整合,得到目标报表。2.根据权利要求1所述的数据溯源分析方法,其特征在于,在所述通过利用提取模型对所述待处理数据中的保单数据进行特征提取之前,还包括:利用第二预设条件来识别所述保单数据中的异常值,提取所述异常值所处位置的文本数据;通过语义识别模型对所述文本数据进行语义提取,得到提取结果;利用所述提取结果对所述异常值进行纠正。3.根据权利要求1所述的数据溯源分析方法,其特征在于,所述通过利用提取模型对所述待处理数据中的保单数据进行特征提取包括:通过所述提取模型中预设的正则表达式来对所述保单数据进行特征提取,得到标准化数据。4.根据权利要求1所述的数据溯源分析方法,其特征在于,所述通过利用提取模型对所述待处理数据中的保单数据进行特征提取,得到标准化数据包括:将所述保单数据中的各段落文本分别输入提取模型进行特征提取,得到各段落对应的关键数据,所述提取模型基于LDA模型训练得到;将所述保单数据中各段落对应的关键数据进行组合,得到所述标准化数据。5.根据权利要求1所述的数据溯源分析方法,其特征在于,在所述通过利用提取模型对所述待处理数据中的保单数据进行特征提取,得到标准化数据之后,还包括:基于所述标准化数据中各数据的数据类型,获取所述数据对应的标准数据类型;将...

【专利技术属性】
技术研发人员:王海平
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1