基于人工智能的异常检测方法、装置、计算机设备及介质制造方法及图纸

技术编号:37718197 阅读:8 留言:0更新日期:2023-06-02 00:15
本申请属于人工智能领域,涉及一种基于人工智能的异常检测方法及其相关设备,该方法包括获取待检测企业的当前状态以及与当前状态对应的可选动作集,并将当前状态输入至预设的强化学习模型进行风险检测,确定可选动作集中各可选动作对应的所有收益预测值,然后再从所有的收益预测值中选取最大收益预测值,最后将最大收益预测值与当前状态对应的实际收益值进行比对,根据所述比对结果,确定所述待检测企业为风险企业。本申请还涉及区块链技术,企业信息和强化学习模型可存储于区块链中。本申请通过强化学习模型可以获取当前状态对应的所有期望预测值中最大值,以准确地对企业为风险企业进行检测。险企业进行检测。险企业进行检测。

【技术实现步骤摘要】
基于人工智能的异常检测方法、装置、计算机设备及介质


[0001]本申请涉及人工智能
,尤其涉及基于人工智能的异常检测方法、装置、计算机设备及存储介质。

技术介绍

[0002]企业客户作为保险机构的大型客户是非常重要的,而不同类型企业,其自定义个性化的产品非常的多。因此,针对企业理赔风控非常难以用固定的标签去判断的,大多只能依赖于企业所属的行业和地区来进行风险筛查,导致企业隐性风险比车险、非车险中更难以被发掘。因企业特征标签难以固定,自定义个性化过高,对已标注的数据搭建有监督学习里的二分类算法的风险检测模型是有失偏重的,存在大量的特征无法被定义、标签太泛的缺陷,无法有效检测企业风险;并且,该方式不适用于团体企业的场景。

技术实现思路

[0003]本申请实施例的目的在于提出一种基于人工智能的异常检测方法、装置、计算机设备及存储介质,以解决现有监督学习里的二分类算法的风险检测模型无法有效检测企业风险的技术问题。
[0004]为了解决上述技术问题,本申请实施例提供一种基于人工智能的异常检测方法,包括下述步骤:
[0005]获取待检测企业的当前状态以及与所述当前状态对应的可选动作集;
[0006]将所述当前状态输入至预设的强化学习模型进行风险检测,确定所述可选动作集中各可选动作对应的所有收益预测值;
[0007]从所有的所述收益预测值中选取最大收益预测值;
[0008]将所述最大收益预测值与所述当前状态对应的实际收益值进行比对,得到比对结果;
[0009]根据所述比对结果,确定所述待检测企业为风险企业。
[0010]进一步的,在所述将所述当前状态输入至预设的强化学习模型进行风险检测的步骤之前,还包括:
[0011]获取企业训练样本,其中,所述企业训练样本中包括每一样本企业从初始状态至最终状态的各个状态数据以及各个所述状态数据对应的交互动作;
[0012]确定各个所述状态数据对应的交互动作的收益期望值;
[0013]基于各个所述状态数据以及各个所述状态数据对应的交互动作的收益期望值,训练所述强化学习模型,得到训练好的强化学习模型,并将训练好的强化学习模型作为所述预设的强化学习模型。
[0014]进一步的,所述确定各个所述状态数据对应的交互动作的收益期望值的步骤,包括:
[0015]将各个所述状态数据输入至神经网络,并通过所述神经网络计算各个所述状态数
据对应的交互动作的收益期望值,其中,每一所述状态数据中对应至少一个交互动作,每一所述状态数据具有至少一个收益期望值。
[0016]进一步的,在每一所述状态数据中对应多个交互动作时,所述将各个所述状态数据输入至神经网络,并通过所述神经网络计算各个所述状态数据对应的交互动作的收益期望值的步骤包括:
[0017]将所述当前状态输入预先训练的意图识别模型,得到企业的下一状态意图;
[0018]基于所述企业的下一状态意图,从所述多个交互动作中确定与所述企业的下一状态意图相匹配的动作,归为意图动作集,并将剩余的交互动作归为禁选动作集;
[0019]将各个所述状态数据输入至神经网络,并通过所述神经网络计算各个所述状态数据对应的意图动作集各个意图动作的收益期望值。
[0020]进一步的,所述获取企业训练样本的步骤之前,还包括:
[0021]将所有的企业样本数据中与黑名单列表进行黑名单匹配,所述黑名单列表包括黑产业的企业、黑区域的企业以及存在历史欺诈风险的企业;
[0022]当所述黑名单匹配成功时,剔除匹配成功的企业样本数据,并将剩余的企业样本数据作为企业训练样本。
[0023]进一步的,所述基于各个所述状态数据以及各个所述状态数据对应的交互动作的收益期望值,训练所述强化学习模型的步骤包括:
[0024]获取各个所述状态数据对应的下一状态数据的最大收益期望值;
[0025]根据最大收益期望值、预设衰变值、奖励性衰变系数以及各个状态数据对应的回报值,对各个所述状态数据对应的交互动作的收益期望值进行更新,得到各个所述状态数据对应的交互动作的最终收益期望值;
[0026]基于各个所述状态数据以及各个所述状态数据对应的交互动作的最终收益期望值,训练所述强化学习模型。
[0027]进一步的,所述根据所述比对结果,确定所述待检测企业为风险企业的步骤包括:
[0028]若所述最大收益预测值小于所述当前状态对应的实际收益值,确定所述待检测企业存在欺诈风险;
[0029]若所述最大收益预测值大于所述当前状态对应的实际收益值,则返回执行获取待检测企业的当前状态以及与所述当前状态对应的可选动作集的步骤。
[0030]为了解决上述技术问题,本申请实施例还提供一种基于人工智能的异常检测装置,包括:
[0031]获取模块,用于获取待检测企业的当前状态以及与所述当前状态对应的可选动作集;
[0032]输入模块,用于将所述当前状态输入至预设的强化学习模型进行风险检测,确定所述可选动作集中各可选动作对应的所有收益预测值;
[0033]选取模块,用于从所有的所述收益预测值中选取最大收益预测值;
[0034]比对模块,用于将所述最大收益预测值与所述当前状态对应的实际收益值进行比对,得到比对结果;
[0035]确定模块,用于根据所述比对结果,确定所述待检测企业为风险企业,采用了如下所述的技术方案:
[0036]为了解决上述技术问题,本申请实施例还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如上任意所述的基于人工智能的异常检测方法的步骤。
[0037]为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如上任意所述的基于人工智能的异常检测方法的步骤。
[0038]与现有技术相比,本申请实施例主要有以下有益效果:
[0039]本申请提供的技术方案,通过获取待检测企业的当前状态以及与所述当前状态对应的可选动作集,并将所述当前状态输入至预设的强化学习模型进行风险检测,确定所述可选动作集中各可选动作对应的所有收益预测值,然后再从所有的所述收益预测值中选取最大收益预测值,最后将所述最大收益预测值与所述当前状态对应的实际收益值进行比对,得到比对结果后,根据所述比对结果,确定所述待检测企业为风险企业。这样,通过强化学习模型可以准确地获取待检测企业的当前状态对应的期望预测值,从而可以根据期望预测值中最大值准确地对企业为风险企业进行检测。并且,上述检测方法具备通用性,不依赖环境的特征,可极大地提升检测精确度,适用于大部分团体场景。
附图说明
[0040]为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的异常检测方法,其特征在于,包括下述步骤:获取待检测企业的当前状态以及与所述当前状态对应的可选动作集;将所述当前状态输入至预设的强化学习模型进行风险检测,确定所述可选动作集中各可选动作对应的所有收益预测值;从所有的所述收益预测值中选取最大收益预测值;将所述最大收益预测值与所述当前状态对应的实际收益值进行比对,得到比对结果;根据所述比对结果,确定所述待检测企业为风险企业。2.根据权利要求1所述的基于人工智能的异常检测方法,其特征在于,在所述将所述当前状态输入至预设的强化学习模型进行风险检测的步骤之前,还包括:获取企业训练样本,其中,所述企业训练样本中包括每一样本企业从初始状态至最终状态的各个状态数据以及各个所述状态数据对应的交互动作;确定各个所述状态数据对应的交互动作的收益期望值;基于各个所述状态数据以及各个所述状态数据对应的交互动作的收益期望值,训练所述强化学习模型,得到训练好的强化学习模型,并将训练好的强化学习模型作为所述预设的强化学习模型。3.根据权利要求2所述的基于人工智能的异常检测方法,其特征在于,所述确定各个所述状态数据对应的交互动作的收益期望值的步骤,包括:将各个所述状态数据输入至神经网络,并通过所述神经网络计算各个所述状态数据对应的交互动作的收益期望值,其中,每一所述状态数据中对应至少一个交互动作,每一所述状态数据具有至少一个收益期望值。4.根据权利要求3所述的基于人工智能的异常检测方法,其特征在于,在每一所述状态数据中对应多个交互动作时,所述将各个所述状态数据输入至神经网络,并通过所述神经网络计算各个所述状态数据对应的交互动作的收益期望值的步骤包括:将所述当前状态输入预先训练的意图识别模型,得到企业的下一状态意图;基于所述企业的下一状态意图,从所述多个交互动作中确定与所述企业的下一状态意图相匹配的动作,归为意图动作集,并将剩余的交互动作归为禁选动作集;将各个所述状态数据输入至神经网络,并通过所述神经网络计算各个所述状态数据对应的意图动作集各个意图动作的收益期望值。5.根据权利要求4所述的基于人工智能的异常检测方法,其特征在于,所述获取企业训练样本的步骤之前,还包括:将所有的企业样本数据中与黑名单列表...

【专利技术属性】
技术研发人员:陈奕宇
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1