风险数据识别方法、终端设备及计算机可读存储介质技术

技术编号:30918938 阅读:20 留言:0更新日期:2021-11-23 00:08
本发明专利技术公开了一种风险数据识别方法、终端设备及计算机可读存储介质,所述风险数据识别方法包括:通过使用由朴素贝叶斯算法构建的计算模型从多个评估角度综合评估待评估数据,如待评估报表数据与样本集均值的契合程度、与样本集整体变化趋势的符合程度和与样本集中最大值和最小值的关系,使得评价结果更加准确,同时还将输出的评估结果输入计算模型的样本集中进行更新,使得计算模型整体评估标准可以适应应用环境的变化趋势,无需人工根据应用环境的变化趋势二次评估,评估过程更加迅速,满足企业获取商业信息的时效性需求。足企业获取商业信息的时效性需求。足企业获取商业信息的时效性需求。

【技术实现步骤摘要】
风险数据识别方法、终端设备及计算机可读存储介质


[0001]本专利技术涉及房地产BI领域领域以及数据识别技术,尤其涉及一种风险数据识别方法、终端设备及计算机可读存储介质。

技术介绍

[0002]在房地产BI(Business Intelligence,商业智能)领域,涉及很多的数据或者指标,如认购未签约数、逾期未签约数、已售货量、剩余货量、回款率等等;这些是房地产从业人员最关心的数据指标,但是这些数据指标往往是变化的且变化趋势也是动态的,有的变化是正常的波动,但有的变化则不正常,而这些异常变化的数据可以反映出一些商业信息。而目前识别数据指标变化是否异常是通过设定简单的规则识别且最终识别结果往往不够准确,还需要人工进一步判断数据指标变化是否异常,对企业及时跟进商业信息或者及时调整经营策略带来了一定的麻烦。

技术实现思路

[0003]本专利技术的主要目的在于提供一种风险数据识别方法,旨在解决目前识别数据指标变化是否异常的技术识别结果不准确,还需人工进一步判断的技术问题。
[0004]为实现上述目的,本专利技术提供一种风险数据识别方法,所述风险数据识别方法包括以下步骤:将待评估报表数据的数据值和数据生成时间输入训练后的计算模型进行风险评估,得到待评估报表数据的风险评估结果,其中所述计算模型由朴素贝叶斯算法构建;将待评估报表数据的数据生成时间、数据值以及与待评估报表数据对应的风险评估结果作为数据样本增添至训练样本集中;获取所述训练样本集对所述计算模型进行训练,所述训练样本集包括多个数据样本,其中,单个数据样本包括:数据生成时间、数据值以及风险评估结果。
[0005]进一步的,所述将待评估报表数据的数据生成时间、数据值以及与待评估报表数据对应的风险评估结果作为数据样本增添至所述练样本集中包括:根据数据生成时间顺序将待评估报表数据的数据值生成时间、数据值以及与待评估报表数据对应的风险评估结果增添至数据训练样本集前端,同时将数据训练样本集中末端的数据样本删除。
[0006]进一步的,所述将待评估报表数据的数据值和数据生成时间输入训练后的计算模型进行风险评估,得到待评估报表数据的风险评估结果包括:计算待评估报表数据基于训练样本集中所有数据样本的全集特征数;结合所述全集特征数和所述计算模型输出待评估报表数据的风险评估结果,其中,所述风险评估结果包括:正常、轻微异常和严重异常。
[0007]进一步的,所述计算待评估报表数据基于训练样本集中所有数据样本的全集特征数包括:
根据待评估报表数据的数据值与所有数据样本的数据值平均值的比值得到第一全集特征值;将待评估报表数据的数据值、所有数据样本的最小数据值、所有数据样本的最大数据值和所有数据样本的数据值平均值代入预设计算公式得到第二全集特征值;根据待评估报表数据的数据值分别与所有数据样本的最小数据值或者预所有数据样本的最大数据值的大小关系得到第三全集特征值;根据待评估报表数据的数据值与所有数据样本的线性回归值的比值得到第四全集特征值;其中,所述全集特征数包括第一全集特征值、第二全集特征值、第三全集特征值和第四全集特征值。
[0008]进一步的,所述计算待评估报表数据基于训练样本集中所有数据样本的全集特征数的步骤之后,还包括:计算待评估报表数据基于训练样本集中预设时间段内数据样本的时间窗口特征数,其中,时间窗口特征数包括:第一时间窗口特征值、第二时间窗口特征值、第三时间窗口特征值和第四时间窗口特征值;根据待评估报表数据的数据值与预设时间段内数据样本的数据值平均值的比值得到第一时间窗口特征值;将待评估报表数据的数据值、预设时间段内数据样本的最小数据值、预设时间段内数据样本的最大数据值和预设时间段内数据样本的数据值平均值代入预设计算公式得到第二时间窗口特征值;根据待评估报表数据的数据值分别与预设时间段内数据样本的最小数据值或者预设时间段内数据样本的最大数据值的大小关系得到第三时间窗口特征值;根据待评估报表数据的数据值与预设时间段内数据样本的线性回归值的比值得到第四时间窗口特征值;结合所述全集特征数、所述时间窗口特征数和所述计算模型输出待评估报表数据的风险评估结果。
[0009]进一步的,所述预设计算公式为:其中,a为待评估报表数据的数据值、b为数据集中最小值、c为数据集中最大值、d为数据集中数据值的平均值。
[0010]进一步的,所述结合所述全集特征数、所述时间窗口特征数和所述计算模型输出待评估报表数据的风险评估结果包括:根据待评估报表数据的每个特征值,分别计算待评估报表数据风险评估结果为正常的权重、轻微异常的权重和严重异常的权重,将权重最大的风险评估结果作为待评估报表数据的风险评估结果输出。
[0011]进一步的,所述分别计算待评估报表数据风险评估结果为正常的权重、轻微异常的权重和严重异常的权重包括:根据待评估报表数据每个特征值在风险评估结果为正常的训练样本集中出现的
频率计算待评估报表数据评结果为正常的权重;根据待评估报表数据每个特征值在风险评估结果为轻微异常的训练样本集中出现的频率计算待评估报表数据评结果为轻微异常的权重;根据待评估报表数据每个特征值在风险评估结果为严重异常的训练样本集中出现的频率计算待评估报表数据评结果为严重异常的权重。
[0012]此外,为实现上述目的,本专利技术还提供一种终端设备,其特征在于,所述终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的风险数据识别程序,所述风险数据识别程序被所述处理器执行时实现如上述的风险数据识别方法的步骤。
[0013]此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,其特征在于,所述可读存储介质上存储有风险数据识别程序,所述风险数据识别程序被处理器执行时实现如上述的风险数据识别方法的步骤。
[0014]本专利技术实施例提出的一种风险数据识别方法,通过从多个评估角度综合评估待评估报表数据,比较待评估报表数据和样本集均值、待评估报表数据和样本集整体变化趋势以及待评估报表数据与样本集中最大值和最小值的关系,使得评估结果更加客观准确,同时还将输出的评估结果输入计算模型的样本集中进行更新,使得计算模型整体评估标准可以适应应用环境的变化趋势,无需人工根据应用环境的变化趋势二次评估,评估过程更加迅速,满足企业获取商业信息的时效性需求。
附图说明
[0015]图1是本专利技术实施例方案涉及的硬件运行环境的终端设备结构示意图;图2为本专利技术风险数据识别方法第一实施例的流程示意图;图3为本专利技术风险数据识别方法第二实施例的流程示意图。
[0016]本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0017]应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0018]本专利技术实施例的主要解决方案是:通过从多个评估角度综合评估待评估报表数据,比较待评估报表数据和样本集均值、待评估报表数据和样本集整体变化趋势以及待评估报表数据与样本集中最大值和最小值的关系,来输出待评估报表本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种风险数据识别方法,其特征在于,所述风险数据识别方法包括以下步骤:将待评估报表数据的数据值和数据生成时间输入训练后的计算模型进行风险评估,得到待评估报表数据的风险评估结果,其中所述计算模型由朴素贝叶斯算法构建;将待评估报表数据的数据生成时间、数据值以及与待评估报表数据对应的风险评估结果作为数据样本增添至训练样本集中;获取所述训练样本集对所述计算模型进行训练,所述训练样本集包括多个数据样本,其中,单个数据样本包括:数据生成时间、数据值以及风险评估结果。2.如权利要求1所述的风险数据识别方法,其特征在于,所述将待评估报表数据的数据生成时间、数据值以及与待评估报表数据对应的风险评估结果作为数据样本增添至所述练样本集中包括:根据数据生成时间顺序将待评估报表数据的数据值生成时间、数据值以及与待评估报表数据对应的风险评估结果增添至数据训练样本集前端,同时将数据训练样本集中末端的数据样本删除。3.如权利要求2所述的风险数据识别方法,其特征在于,所述将待评估报表数据的数据值和数据生成时间输入训练后的计算模型进行风险评估,得到待评估报表数据的风险评估结果包括:计算待评估报表数据基于训练样本集中所有数据样本的全集特征数;结合所述全集特征数和所述计算模型输出待评估报表数据的风险评估结果,其中,所述风险评估结果包括:正常、轻微异常和严重异常。4.如权利要求3所述的风险数据识别方法,其特征在于,所述计算待评估报表数据基于训练样本集中所有数据样本的全集特征数包括:根据待评估报表数据的数据值与所有数据样本的数据值平均值的比值得到第一全集特征值;将待评估报表数据的数据值、所有数据样本的最小数据值、所有数据样本的最大数据值和所有数据样本的数据值平均值代入预设计算公式得到第二全集特征值;根据待评估报表数据的数据值分别与所有数据样本的最小数据值或者预所有数据样本的最大数据值的大小关系得到第三全集特征值;根据待评估报表数据的数据值与所有数据样本的线性回归值的比值得到第四全集特征值;其中,所述全集特征数包括第一全集特征值、第二全集特征值、第三全集特征值和第四全集特征值。5.如权利要求4所述的风险数据识别方法,其特征在于,所述计算待评估报表数据基于训练样本集中所有数据样本的全集特征数的步骤之后,还包括:计算待评估报表数据基于训练样本集中预设时间段内数据样本的时间窗口特征数,其中,时间窗口特征数包括:第一时间窗口特征值、第二时间...

【专利技术属性】
技术研发人员:温桂龙
申请(专利权)人:深圳市明源云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1