风险数据识别方法、终端设备及计算机可读存储介质技术

技术编号:30918938 阅读:37 留言:0更新日期:2021-11-23 00:08
本发明专利技术公开了一种风险数据识别方法、终端设备及计算机可读存储介质,所述风险数据识别方法包括:通过使用由朴素贝叶斯算法构建的计算模型从多个评估角度综合评估待评估数据,如待评估报表数据与样本集均值的契合程度、与样本集整体变化趋势的符合程度和与样本集中最大值和最小值的关系,使得评价结果更加准确,同时还将输出的评估结果输入计算模型的样本集中进行更新,使得计算模型整体评估标准可以适应应用环境的变化趋势,无需人工根据应用环境的变化趋势二次评估,评估过程更加迅速,满足企业获取商业信息的时效性需求。足企业获取商业信息的时效性需求。足企业获取商业信息的时效性需求。

【技术实现步骤摘要】
风险数据识别方法、终端设备及计算机可读存储介质


[0001]本专利技术涉及房地产BI领域领域以及数据识别技术,尤其涉及一种风险数据识别方法、终端设备及计算机可读存储介质。

技术介绍

[0002]在房地产BI(Business Intelligence,商业智能)领域,涉及很多的数据或者指标,如认购未签约数、逾期未签约数、已售货量、剩余货量、回款率等等;这些是房地产从业人员最关心的数据指标,但是这些数据指标往往是变化的且变化趋势也是动态的,有的变化是正常的波动,但有的变化则不正常,而这些异常变化的数据可以反映出一些商业信息。而目前识别数据指标变化是否异常是通过设定简单的规则识别且最终识别结果往往不够准确,还需要人工进一步判断数据指标变化是否异常,对企业及时跟进商业信息或者及时调整经营策略带来了一定的麻烦。

技术实现思路

[0003]本专利技术的主要目的在于提供一种风险数据识别方法,旨在解决目前识别数据指标变化是否异常的技术识别结果不准确,还需人工进一步判断的技术问题。
[0004]为实现上述目的,本专利技术提供一种风险数据本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种风险数据识别方法,其特征在于,所述风险数据识别方法包括以下步骤:将待评估报表数据的数据值和数据生成时间输入训练后的计算模型进行风险评估,得到待评估报表数据的风险评估结果,其中所述计算模型由朴素贝叶斯算法构建;将待评估报表数据的数据生成时间、数据值以及与待评估报表数据对应的风险评估结果作为数据样本增添至训练样本集中;获取所述训练样本集对所述计算模型进行训练,所述训练样本集包括多个数据样本,其中,单个数据样本包括:数据生成时间、数据值以及风险评估结果。2.如权利要求1所述的风险数据识别方法,其特征在于,所述将待评估报表数据的数据生成时间、数据值以及与待评估报表数据对应的风险评估结果作为数据样本增添至所述练样本集中包括:根据数据生成时间顺序将待评估报表数据的数据值生成时间、数据值以及与待评估报表数据对应的风险评估结果增添至数据训练样本集前端,同时将数据训练样本集中末端的数据样本删除。3.如权利要求2所述的风险数据识别方法,其特征在于,所述将待评估报表数据的数据值和数据生成时间输入训练后的计算模型进行风险评估,得到待评估报表数据的风险评估结果包括:计算待评估报表数据基于训练样本集中所有数据样本的全集特征数;结合所述全集特征数和所述计算模型输出待评估报表数据的风险评估结果,其中,所述风险评估结果包括:正常、轻微异常和严重异常。4.如权利要求3所述的风险数据识别方法,其特征在于,所述计算待评估报表数据基于训练样本集中所有数据样本的全集特征数包括:根据待评估报表数据的数据值与所有数据样本的数据值平均值的比值得到第一全集特征值;将待评估报表数据的数据值、所有数据样本的最小数据值、所有数据样本的最大数据值和所有数据样本的数据值平均值代入预设计算公式得到第二全集特征值;根据待评估报表数据的数据值分别与所有数据样本的最小数据值或者预所有数据样本的最大数据值的大小关系得到第三全集特征值;根据待评估报表数据的数据值与所有数据样本的线性回归值的比值得到第四全集特征值;其中,所述全集特征数包括第一全集特征值、第二全集特征值、第三全集特征值和第四全集特征值。5.如权利要求4所述的风险数据识别方法,其特征在于,所述计算待评估报表数据基于训练样本集中所有数据样本的全集特征数的步骤之后,还包括:计算待评估报表数据基于训练样本集中预设时间段内数据样本的时间窗口特征数,其中,时间窗口特征数包括:第一时间窗口特征值、第二时间...

【专利技术属性】
技术研发人员:温桂龙
申请(专利权)人:深圳市明源云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1