基于人工智能的异常数据识别方法及相关设备技术

技术编号:25954898 阅读:39 留言:0更新日期:2020-10-17 03:47
本发明专利技术涉及人工智能技术领域,提供一种基于人工智能的异常数据识别方法,包括:接收输入的医学数据;对所述医学数据进行医学处理,获得处理数据;将所述处理数据输入至预先训练好的组合分类器模型中,获得分类预测结果,其中,所述组合分类型模型是基于多个维度训练得到的;根据所述分类预测结果,对所述医学数据的每个聚类进行异常判定,获得聚类异常结果;通过引导聚集算法bagging,根据所述聚类异常结果,对所述医学数据所匹配的就诊记录进行异常判定,获得就诊记录异常结果。本发明专利技术还涉及区块链技术,可以将就诊记录异常结果上传至区块链上。本申请可应用于智慧医疗场景中,从而推动智慧城市的建设。

【技术实现步骤摘要】
基于人工智能的异常数据识别方法及相关设备
本专利技术涉及人工智能
,尤其涉及一种基于人工智能的异常数据识别方法及相关设备。
技术介绍
随着社会医疗保障制度的不断完善,人们的看病就医问题得到了解决。目前,人们在看病就医后,可以拿着病例数据去报销一部分医疗费用,这从很大程度减轻了人们的医疗费用问题。然而,实践中发现,有些非法用户会捏造医疗数据去报销医疗费用,如果这些非法用户报销的医疗费用数额很大,将会导致没有足够的资金来保障合法用户的医疗报销,这无疑会影响合法用户的合法权益。因此,如何对医学数据进行异常风险识别是一个亟待解决的技术问题。
技术实现思路
鉴于以上内容,有必要提供一种基于人工智能的异常数据识别方法及相关设备,能够对医学数据进行异常风险识别。本专利技术的第一方面提供一种基于人工智能的异常数据识别方法,所述基于人工智能的异常数据识别方法包括:接收输入的医学数据;对所述医学数据进行医学处理,获得处理数据;将所述处理数据输入至预先训练好的组合分类器模型中,获得分类预测结果,其中,所述组合分类型模型是基于多个维度训练得到的;根据所述分类预测结果,对所述医学数据的每个聚类进行异常判定,获得聚类异常结果;通过引导聚集算法bagging,根据所述聚类异常结果,对所述医学数据所匹配的就诊记录进行异常判定,获得就诊记录异常结果。在一种可能的实现方式中,所述对所述医学数据进行医学处理,获得处理数据包括:对所述医学数据中的非标准数据进行标准转换,获得第一数据;对所述医学数据中的错误数据进行更正,获得第二数据;对所述医学数据中的年龄数据按照年龄进行转换,获得第三数据;将所述第一数据、所述第二数据、所述第三数据以及所述医学数据中未被处理的数据确定为处理数据。在一种可能的实现方式中,所述根据所述分类预测结果,对所述医学数据的每个聚类进行异常判定,获得聚类异常结果包括:针对每个所述聚类,获取所述聚类的异常数量阈值;判断所述分类预测结果中判定所述聚类的处理数据为异常数据的数量是否超过所述异常数量阈值;若所述分类预测结果中判定所述聚类的处理数据为异常数据的数量超过所述异常数量阈值,确定所述聚类为异常聚类;或若所述分类预测结果中判定所述聚类的处理数据为异常数据的数量未超过所述异常数量阈值,确定所述聚类为正常聚类。在一种可能的实现方式中,所述通过引导聚集算法bagging,根据所述聚类异常结果,对所述医学数据所匹配的就诊记录进行异常判定,获得就诊记录异常结果包括:将所述医学数据按照就诊记录进行划分,获得多条就诊记录数据;针对每条所述就诊记录数据,通过引导聚集算法bagging,确定出现异常聚类的第一就诊记录数据以及未出现异常聚类的第二就诊记录数据;分别为所述第一就诊记录数据和所述第二就诊记录数据设置异常标识。在一种可能的实现方式中,所述接收输入的医学数据之前,所述基于人工智能的异常数据识别方法还包括:获取第一测试集、第二测试集和第三测试集;基于高斯混合模型GMM,对所述第一测试集进行训练,获得第一分类器;基于KL散度,对所述第二测试集进行训练,获得第二分类器;基于深度对抗聚类DASC,对所述第三测试集进行训练,获得第三分类器;对所述第一分类器、所述第二分类器以及所述第三分类器进行组合,获得组合分类器模型。在一种可能的实现方式中,所述基于人工智能的异常数据识别方法还包括:根据所述就诊记录异常结果,从多条所述就诊记录数据中确定异常就诊记录数据;针对所述异常就诊记录数据,根据预设的聚类权重,计算每条所述异常就诊记录数据的异常分值;根据所述异常分值,确定每条所述异常就诊记录数据的异常程度级别。在一种可能的实现方式中,所述基于人工智能的异常数据识别方法还包括:判断所述异常程度级别是否高于预设异常级别阈值;若所述异常程度级别高于预设异常级别阈值,确定所述异常就诊记录数据所属的用户为高风险用户。本专利技术的第二方面提供一种异常数据识别装置,其特征在于,所述异常数据识别装置包括:接收模块,用于接收输入的医学数据;处理模块,用于对所述医学数据进行医学处理,获得处理数据;输入模块,用于将所述处理数据输入至预先训练好的组合分类器模型中,获得分类预测结果,其中,所述组合分类型模型是基于多个维度训练得到的;判定模块,用于根据所述分类预测结果,对所述医学数据的每个聚类进行异常判定,获得聚类异常结果;匹配模块,用于通过引导聚集算法bagging,根据所述聚类异常结果,对所述医学数据所匹配的就诊记录进行异常判定,获得就诊记录异常结果;上传模块,用于将所述就诊记录异常结果上传至区块链。本专利技术的第三方面提供一种电子设备,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现所述的基于人工智能的异常数据识别方法。本专利技术的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的基于人工智能的异常数据识别方法。在上述技术方案中,可以基于多个维度的分类器对医学数据进行分类预测,识别出药品异常,检查异常,患者异常,医生异常,医疗机构异常等,最终判断该次就诊记录是否正常,则被标记为异常记录。将多维度的异常识别模型应用在医保风控中,能够对医学数据的异常进行精准识别,同时,不强依赖于医学知识和医学背景,有利于识别出高风险的欺诈骗保用户。附图说明图1是本专利技术公开的一种基于人工智能的异常数据识别方法的较佳实施例的流程图。图2是本专利技术公开的一种异常数据识别装置的较佳实施例的功能模块图。图3是本专利技术实现基于人工智能的异常数据识别方法的较佳实施例的电子设备的结构示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本申请的说明书和权利要求书中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本专利技术要求的保护范围之内。所述电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备本文档来自技高网...

【技术保护点】
1.一种基于人工智能的异常数据识别方法,其特征在于,所述基于人工智能的异常数据识别方法包括:/n接收输入的医学数据;/n对所述医学数据进行医学处理,获得处理数据;/n将所述处理数据输入至预先训练好的组合分类器模型中,获得分类预测结果,其中,所述组合分类型模型是基于多个维度训练得到的;/n根据所述分类预测结果,对所述医学数据的每个聚类进行异常判定,获得聚类异常结果;/n通过引导聚集算法bagging,根据所述聚类异常结果,对所述医学数据所匹配的就诊记录进行异常判定,获得就诊记录异常结果。/n

【技术特征摘要】
1.一种基于人工智能的异常数据识别方法,其特征在于,所述基于人工智能的异常数据识别方法包括:
接收输入的医学数据;
对所述医学数据进行医学处理,获得处理数据;
将所述处理数据输入至预先训练好的组合分类器模型中,获得分类预测结果,其中,所述组合分类型模型是基于多个维度训练得到的;
根据所述分类预测结果,对所述医学数据的每个聚类进行异常判定,获得聚类异常结果;
通过引导聚集算法bagging,根据所述聚类异常结果,对所述医学数据所匹配的就诊记录进行异常判定,获得就诊记录异常结果。


2.根据权利要求1所述的基于人工智能的异常数据识别方法,其特征在于,所述对所述医学数据进行医学处理,获得处理数据包括:
对所述医学数据中的非标准数据进行标准转换,获得第一数据;
对所述医学数据中的错误数据进行更正,获得第二数据;
对所述医学数据中的年龄数据按照年龄进行转换,获得第三数据;
将所述第一数据、所述第二数据、所述第三数据以及所述医学数据中未被处理的数据确定为处理数据。


3.根据权利要求1所述的基于人工智能的异常数据识别方法,其特征在于,所述根据所述分类预测结果,对所述医学数据的每个聚类进行异常判定,获得聚类异常结果包括:
针对每个所述聚类,获取所述聚类的异常数量阈值;
判断所述分类预测结果中判定所述聚类的处理数据为异常数据的数量是否超过所述异常数量阈值;
若所述分类预测结果中判定所述聚类的处理数据为异常数据的数量超过所述异常数量阈值,确定所述聚类为异常聚类;或
若所述分类预测结果中判定所述聚类的处理数据为异常数据的数量未超过所述异常数量阈值,确定所述聚类为正常聚类。


4.根据权利要求1所述的基于人工智能的异常数据识别方法,其特征在于,所述通过引导聚集算法bagging,根据所述聚类异常结果,对所述医学数据所匹配的就诊记录进行异常判定,获得就诊记录异常结果包括:
将所述医学数据按照就诊记录进行划分,获得多条就诊记录数据;
针对每条所述就诊记录数据,通过引导聚集算法bagging,确定出现异常聚类的第一就诊记录数据以及未出现异常聚类的第二就诊记录数据;
分别为所述第一就诊记录数据和所述第二就诊记录数据设置异常标识。


5.根据权利要求1至4任一项所述的基于人工智能的异常数据识别方法,其特征在于,所述接收输入的医学数据之...

【专利技术属性】
技术研发人员:刘伟张旭
申请(专利权)人:平安医疗健康管理股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1