一种大数据业务规则的挖掘方法及装置制造方法及图纸

技术编号：42666102 阅读：41 留言：0更新日期：2024-09-10 12:22

本申请提供一种大数据业务规则的挖掘方法及装置，包括：获取N行第一样本数据；根据N行第一样本数据，确定N*N行矩阵；行矩阵包括N个行指标特征；将N行第一样本数据和行矩阵合并，确定N行第二样本数据，第i个行指标特征为第一数值时表征对应的样本数据处于第i行；通过N行第二样本数据，确定出与因变量存在业务关系的自变量；根据存在业务关系的自变量中的H个行指标特征对应的H行第一样本数据，构建存在业务关系的自变量中的K个业务指标特征与因变量之间的业务规则；从N行第二样本数据中除去H个行指标特征指示的第二样本数据后，对N‑H行的第二样本数据继续挖掘业务规则。该方案能够准确有效地从海量的数据中挖掘出数据业务规则。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机，尤其涉及一种大数据业务规则的挖掘方法及装置。

技术介绍

1、随着金融数字化进程的不断演进，系统每天产生海量的数据，在金融领域中绝大部分数据往往存在明显的线性关系，例如财务报表指标、内部户金额监测等场景。

2、现有技术采用滑动窗口回归算法从海量的数据中挖掘出不同的数据业务规则；但是，一方面，滑动窗口回归算法依赖样本数据的有序性；而现实中样本数据的质量往往良莠不齐，数据排序也一定有难以找到合理的排序依据，导致样本数据和对应的规则分布不连续；采用滑动窗口回归算法无法正确挖掘出数据业务规则；另一方面，滑动窗口回归算法中窗口的大小往往是基于历史经验确定，针对不同金融数据场景很难动态调整窗口的大小，窗口的大小设置过大，可能导致具有统一业务规则的在小于窗口大小的条件样本数据过小时，中满足的业务规则无法成功挖掘；窗口的大小设置过小，则在小范围样本中可能回归效果不佳。再一方面，滑动窗口回归算法迭代次数较多，整体算法的效率较差。

3、那么，如何准确有效地从海量的数据中挖掘出数据业务规则，有待解决。

...

【技术特征摘要】

1.一种大数据业务规则的挖掘方法，其特征在于，包括：
2.如权利要求1所述的方法，其特征在于，所述通过所述n行第二样本数据，确定出与因变量存在业务关系的自变量，包括：
3.如权利要求2所述的方法，其特征在于，所述将贡献度最大的新引入自变量添加至所述第j次迭代的自变量集合，得到第j+1次迭代的自变量集合，包括：
4.如权利要求2所述的方法，其特征在于，所述通过第一线性模型和第二线性模型，确定所述新引入自变量的贡献度，包括：
5.如权利要求3所述的方法，其特征在于，所述通过第三线性模型和第四线性模型，确定所述剔除自变量...

【专利技术属性】
技术研发人员：庄海琪，林炳鑫，
申请(专利权)人：深圳前海微众银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人

上一篇：一种拱脚钢板防护装置制造方法及图纸
下一篇：一种钻探设备制造技术

相关技术

动态调相式的异构数据处理缓冲装置、方...

一种破坏性变更的确定方法、装置、计算...

一种联盟链数据保护方法及装置制造方法...

一种代码文件打包方法、装置、设备及存...

基于灰雁优化算法的违约预测方法、装置...

多风控策略并行回溯方法、电子设备、存...

一种视频去噪模型的训练方法、装置、设...

基于多分箱方案的回归建模方法、装置、...

一种构建测试数据的方法及装置制造方法...

语言模型训练方法、设备、存储介质以及...

网友询问留言已有0条评论

还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1

发布您的意见

相关领域技术

一种基于三维重建的化工厂罐体监测系统...

一种用于刷卡打印管理的读卡装置制造方...

一种基于改进注意力的Water-Re...

小样本藻类分类识别、装置、电子设备及...

集成电路检测方法、装置和计算机设备制...

外委人员的安全管理方法、装置、设备和...

绝缘子缺陷检测方法、装置、终端、存储...

神经网络模型的量化方法、装置、介质和...