【技术实现步骤摘要】
本申请涉及计算机,尤其涉及一种大数据业务规则的挖掘方法及装置。
技术介绍
1、随着金融数字化进程的不断演进,系统每天产生海量的数据,在金融领域中绝大部分数据往往存在明显的线性关系,例如财务报表指标、内部户金额监测等场景。
2、现有技术采用滑动窗口回归算法从海量的数据中挖掘出不同的数据业务规则;但是,一方面,滑动窗口回归算法依赖样本数据的有序性;而现实中样本数据的质量往往良莠不齐,数据排序也一定有难以找到合理的排序依据,导致样本数据和对应的规则分布不连续;采用滑动窗口回归算法无法正确挖掘出数据业务规则;另一方面,滑动窗口回归算法中窗口的大小往往是基于历史经验确定,针对不同金融数据场景很难动态调整窗口的大小,窗口的大小设置过大,可能导致具有统一业务规则的在小于窗口大小的条件样本数据过小时,中满足的业务规则无法成功挖掘;窗口的大小设置过小,则在小范围样本中可能回归效果不佳。再一方面,滑动窗口回归算法迭代次数较多,整体算法的效率较差。
3、那么,如何准确有效地从海量的数据中挖掘出数据业务规则,有待解决。
【技术保护点】
1.一种大数据业务规则的挖掘方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述通过所述N行第二样本数据,确定出与因变量存在业务关系的自变量,包括:
3.如权利要求2所述的方法,其特征在于,所述将贡献度最大的新引入自变量添加至所述第j次迭代的自变量集合,得到第j+1次迭代的自变量集合,包括:
4.如权利要求2所述的方法,其特征在于,所述通过第一线性模型和第二线性模型,确定所述新引入自变量的贡献度,包括:
5.如权利要求3所述的方法,其特征在于,所述通过第三线性模型和第四线性模型,确定所述剔除自变量的贡献
<...【技术特征摘要】
1.一种大数据业务规则的挖掘方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述通过所述n行第二样本数据,确定出与因变量存在业务关系的自变量,包括:
3.如权利要求2所述的方法,其特征在于,所述将贡献度最大的新引入自变量添加至所述第j次迭代的自变量集合,得到第j+1次迭代的自变量集合,包括:
4.如权利要求2所述的方法,其特征在于,所述通过第一线性模型和第二线性模型,确定所述新引入自变量的贡献度,包括:
5.如权利要求3所述的方法,其特征在于,所述通过第三线性模型和第四线性模型,确定所述剔除自变量...
【专利技术属性】
技术研发人员:庄海琪,林炳鑫,
申请(专利权)人:深圳前海微众银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。