一种基于因果推断的策略效果评估方法及装置制造方法及图纸

技术编号：36794643 阅读：8 留言：0更新日期：2023-03-08 22:57

本发明专利技术公开一种基于因果推断的策略效果评估方法及装置，涉及数据处理技术领域，现有技术存在未根据信贷业务特点选择合适的算法将后验推断问题转化为优化问题进行求解的问题；本发明专利技术观察实验组产品数据的同时找出与实验组产品拟合度最高的产品采集处理数据拟合出对照组数据，实验组产品上线策略而对照组产品不上线策略，然后再对二者的数据进行采集处理分析，分析策略上线与否对业务产品本身有何作用；本发明专利技术拟合时间序列数据过程中将合成控制法、贝叶斯结构时间序列模型及状态空间模型结合使用，考量了符合实际信贷业务的自相关及周期性等因素，自适应地基于数量级采用基于变分推断或哈密尔顿蒙特卡洛方法，将后验推断问题转化为优化问题。题转化为优化问题。题转化为优化问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于因果推断的策略效果评估方法及装置

[0001]本专利技术涉及数据处理
，具体涉及一种基于因果推断的策略效果评估方法及装置。

技术介绍

[0002]现有策略效果评估方法如下：
[0003](1)基于时间序列的显著性评估方法:在信贷全生命周期的各节点进行流程或策略变更时，运用时间序列分析方法，以流程或策略上线时点作为观察区分时间，对比上线前、后的各维度指标数据进行分析进而得出新老版本的效果差异；
[0004](2)A/B测试方法:在流程或策略上制作两个(A/B)或多个(A/B/n)版本，在同一时间维度，分别随机让在各维度分布近似一致的客群的采用不同版本，统计各群组的业务指标数据，最后通过数据分析方法评估出最好的版本，进而正式采用；
[0005](3)基于因果推断的因果效应计算：从策略或流程改变前后的观察性数据中，去发现因果关系、测算因果效应，用于互联网运营场景。
[0006]现有技术方案的缺陷：
[0007]1、银行信贷领域的时间序列数据一般都会产生自回归分量及周期性，但现有因果推断未涉及到银行信贷领域，其目前应用主要都是基于假设各时间点独立同分布的时间序列数据；
[0008]2、未根据信贷业务特点选择合适的算法将后验推断问题转化为优化问题进行求解。

技术实现思路

[0009]为了解决上述现有技术中存在的问题，本专利技术拟提供了一种基于因果推断的策略效果评估方法及装置，拟解决现有策略效果评估方法无法很好预估银行信贷领域的策略或流程上线效果。r/>[0010]一种基于因果推断的策略效果评估方法，包括如下步骤：
[0011]步骤1：选取需测试策略上线效果的业务产品X，选取与业务产品X各维度及趋势性相似度最高的多个业务产品Y、Z，对X、Y、Z业务产品的多维度指标的时间序列数据进行处理获取多维度实验组未操作时间序列数据Real_A_pre并拟合出多维度对照组未操作时间序列数据Pseudo_A_pre，两组数据对比检验拟合数据Pseudo_A_pre的拟合效果，依据拟合效果选择拟合方法；
[0012]步骤2：对策略上线后的业务产品X的时间序列数据进行数据收集及处理，得到多维度实验组已操作时间序列数据Real_A_post；
[0013]步骤3：对未上线策略的业务产品Y、Z的时间序列数据同步骤1的拟合方法拟合得到多维度对照组已操作时间序列数据Pseudo_A_post；
[0014]步骤4：对Real_A_post和Pseudo_A_post进行数据处理计算，得到策略上线后的因
果效果测算。
[0015]优选的，在步骤1中，所述选取与业务产品X各维度及趋势性相似度最高的多个业务产品Y、Z的选取过程如下：
[0016]a、对上线前的各业务产品多维度指标的时间序列数据分别进行自相关及ADF方法下的假设检验，得到各业务产品各维度的自相关性及平稳性验证；
[0017]b、对上线前的各业务产品多维度指标的时间序列数据进行相关性计算，得到在同维度指标下不同业务产品时间序列的相关性；
[0018]c、对前两步的数据结果进行数据分析及处理，得到在同维度指标下不同业务产品的时间序列数据的相似度数据，然后依据相似度选取。
[0019]优选的，在步骤1中
[0020]对X、Y、Z业务产品的多维度指标的时间序列数据进行处理的处理过程如下：
[0021]获取产品X、Y、Z的时间序列Real_A_pre、Real_B_pre、Real_C_pre，其中Real_A_pre作为多维度实验组未操作时间序列数据并结合产品Y、Z的时间序列Real_B_pre、Real_C_pre进行类似集成学习的方法拟合出多维度对照组未操作时间序列数据Pseudo_A_pre，判断拟合效果再决定拟合方法；所述拟合方法包括合成控制法、时间序列模型及状态空间模型。
[0022]所述拟合效果判断依据如下：
[0023]假设检验：(1)Real值始终处于Pseudo值的95％置信区间内；(2)Real和Pseudo的差值始终包括0值；以上即有95％的样本均值会落在2个标准误差范围内，如果满足即接受此拟合方法，如果有多种拟合方法再根据MSE(均方误差)测算后选择误差最小的拟合方法，据此优选的拟合方法为合成控制法加贝叶斯结构化时间序列模型。
[0024]优选的，步骤3中采集未上线策略或流程的业务产品Y、Z的时间序列数据Real_B_post、Real_C_post，将Y、Z的时间序列数据Real_B_post、Real_C_post进行同步骤1的拟合方法拟合得到标准化结构的多维度对照组已操作时间序列数据Psuedo_A_post。
[0025]优选的，在所述步骤4中，包括以下步骤：
[0026]步骤4.1：对上线策略或流程后的业务产品X的Real_A_post进行基于拟合对照组Psuedo_A_post的基于TensorFlow环境的处理，将策略或流程上线这一因素对产品X影响的后验推断问题转化为优化问题进行求解；所述优化问题进行在约束性条件下并设定先验标准差及颗粒度，得到带约束条件的优化问题；
[0027]步骤4.2：对步骤4.1中带约束条件的优化问题进行在基于Horseshoe prior的贝叶斯回归、稀疏线性回归，得到约束条件下的优化问题的协变量回归系数及权重；
[0028]步骤4.3：对上述带约束条件的优化问题进行求解并回推为后验推断问题求解结果，得到策略或流程上线这一因素对产品X影响的量化的因果效应值。
[0029]优选的，在步骤4.1中，所述处理过程中有变分推断及哈密尔顿蒙特卡洛方法两种可选算法，两种算法的选择根据数据量级筛选，自适应采取是更适用于大规模数量级下有更好收敛性及可扩展性的情况采用变分推断算法，还是小规模数量级下采用更优精度的哈密尔顿蒙特卡洛方法；
[0030]优选的，步骤4.1中，所述颗粒度可基于现有时间序列数据的颗粒度，进行放大化的测算。
[0031]优选的，采集产品X、Y、Z时间序列数据的过程中选取的时间段是相同的。
[0032]一种基于因果推断的策略效果评估装置，包括数据存储模块、数据处理模块、模型预测模块、模型验证模块、模型展示模块；其中数据存储模块用于收集各产品的时间序列数据；数据处理模块用于对数据存储模块中的数据进行预处理、周期性分析、平稳、相关性分析找出与待检验产品最相似的产品；模型预测模块利用合成控制法、贝叶斯结构化时间序列对最相似产品的时间序列数据进行拟合使之可仿真出待检验产品在上线策略的时间点若未上线策略的时间序列数据，再利用变分推断或者哈密尔顿蒙特卡洛对上线策略后的实际时间序列数据和拟合的时间序列数据进行因果推断得到反事实推理；模型验证模块进行假设检验；数据展示模块用于展示因果推断结果值及相关分析。
[0033]本专利技术的有益效果包括：
[0034]本专利技术拟合时间序列数据过程中将合成控制法、贝叶斯结构时间序列模型及本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于因果推断的策略效果评估方法，其特征在于，包括如下步骤：步骤1：选取需测试策略上线效果的业务产品X，选取与业务产品X各维度及趋势性相似度最高的多个业务产品Y、Z，对X、Y、Z业务产品的多维度指标的时间序列数据进行处理获取多维度实验组未操作时间序列数据Real_A_pre并拟合出多维度对照组未操作时间序列数据Pseudo_A_pre，两组数据对比检验拟合数据Pseudo_A_pre的拟合效果，依据拟合效果选择拟合方法；步骤2：对策略上线后的业务产品X的时间序列数据进行数据收集及处理，得到多维度实验组已操作时间序列数据Real_A_post；步骤3：对未上线策略的业务产品Y、Z的时间序列数据同步骤1的拟合方法拟合得到多维度对照组已操作时间序列数据Pseudo_A_post；步骤4：对Real_A_post和Pseudo_A_post进行数据处理计算，得到策略上线后的因果效果测算。2.根据权利要求1所述的一种基于因果推断的策略效果评估方法，其特征在于，在步骤1中，所述选取与业务产品X各维度及趋势性相似度最高的多个业务产品Y、Z的选取过程如下：a、对上线前的各业务产品多维度指标的时间序列数据分别进行自相关及ADF方法下的假设检验，得到各业务产品各维度的自相关性及平稳性验证；b、对上线前的各业务产品多维度指标的时间序列数据进行相关性计算，得到在同维度指标下不同业务产品时间序列的相关性；c、对前两步的数据结果进行数据分析及处理，得到在同维度指标下不同业务产品的时间序列数据的相似度数据，然后依据相似度选取。3.根据权利要求1所述的一种基于因果推断的策略效果评估方法，其特征在于，在步骤1中，所述对X、Y、Z业务产品的多维度指标的时间序列数据进行处理的过程如下：获取产品X、Y、Z的时间序列Real_A_pre、Real_B_pre、Real_C_pre，其中Real_A_pre作为多维度实验组未操作时间序列数据并结合产品Y、Z的时间序列Real_B_pre、Real_C_pre进行类似集成学习的方法拟合出多维度对照组未操作时间序列数据Pseudo_A_pre，所述方法包括合成控制法、时间序列模型及状态空间模型；所述拟合效果判断依据如下：假设检验：(1)Real值始终处于Pseudo值的95％置信区间内；(2)Real和Pseudo的差值始终包括0值；以上即有95％的样本均值会落在2个标准误差范围内，如果满足即接受此拟合方法，如果有多种拟合方法再根据MSE测算后选择误差最小的拟合方法。4.根据权利要求3所述的一种基于因果推断的策略效果评估方法，其特征在于，步骤3中采集未上线策略或流程的业...

【专利技术属性】
技术研发人员：寇蓝天，
申请(专利权)人：四川新网银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人