基于机器学习的就诊数据异常识别方法、设备及存储介质技术

技术编号:20844013 阅读:22 留言:0更新日期:2019-04-13 08:53
本发明专利技术公开了一种基于机器学习的就诊数据异常识别方法,包括以下步骤:接收医疗机构采集并上传的参保人的历史就诊数据,并基于预设筛选规则从所述历史就诊数据中筛选出符合建模的就诊数据;以筛选出的就诊数据作为训练样本,采用机器学习方式,建立套项目识别模型;获取待检测就诊数据,并将所述待检测就诊数据导入至所述套项目识别模型进行异常识别,得到识别结果;若所述待检测就诊数据的识别结果为异常,则确定所述待检测就诊数据为套项目违规乱收费。本发明专利技术还公开了一种设备及存储介质。本发明专利技术通过人工智能技术中的机器学习实现数据的智能分析,从而精准有效地识别出可疑的就诊数据,并有效扼制违规的医疗操作。

【技术实现步骤摘要】
基于机器学习的就诊数据异常识别方法、设备及存储介质
本专利技术涉及数据处理
,尤其涉及一种基于机器学习的就诊数据异常识别方法、设备及存储介质。
技术介绍
社会医疗保险是国家和社会根据一定的法律法规,为向保障范围内的劳动者提供患病时基本医疗需求保障而建立的社会保险制度。目前,医疗服务机构分布广泛,为参保人员提供更为便民的医疗服务,然而在利益的驱动下,一些机构出现乱检查、乱开药、重复就诊重复开药、乱收费用等违规操作,浪费了本就有限的医疗资源,同时还损害了参保人员的合法利益,进而不利于医疗质量和医疗健康的可持续发展。
技术实现思路
本专利技术的主要目的在于提供一种基于机器学习的就诊数据异常识别方法、设备及存储介质,旨在解决如何精准有效地识别出可疑的就诊数据,从而有效扼制违规的医疗操作的技术问题。为实现上述目的,本专利技术提供的一种基于机器学习的就诊数据异常识别方法,所述就诊数据异常识别方法包括以下步骤:接收医疗机构采集并上传的所有参保人的历史就诊数据,并基于预设筛选规则从所述历史就诊数据中筛选出符合建模的就诊数据;以筛选出的就诊数据作为训练样本,采用机器学习方式,建立套项目识别模型;获取待检测就诊数据,并将所述待检测就诊数据导入至所述套项目识别模型进行异常识别,得到识别结果;若所述待检测就诊数据的识别结果为异常,则确定所述待检测就诊数据为套项目违规乱收费。可选地,所述基于预设筛选规则从所述历史就诊数据中筛选出符合建模的就诊数据,包括:根据所述历史就诊数据的数据内容,剔除不含有检测和理疗的历史就诊数据,其中,所述数据内容至少包括就诊时间、检测项目、检测费用、理疗项目、理疗费用;根据检测项目和/或理疗项目的预设收费标准,判断剔除后剩余的历史就诊数据中是否存在套项目情况,其中,所述套项目情况至少包括将不收费的项目套用在可收费的项目上、将收费低于第一预设阈值的项目套用在收费高于第二预设阈值的项目上中的任一项;若剔除后剩余的历史就诊数据中存在套项目情况,则将历史就诊数据标注为异常就诊数据;若剔除后剩余的历史就诊数据中不存在套项目情况,则将历史就诊数据标注为正常就诊数据;将标注的所述异常就诊数据和所述正常就诊数据作为建模的就诊数据。可选地,所述以筛选出的就诊数据作为训练样本,采用机器学习方式,建立套项目识别模型,包括:对筛选出的就诊数据进行提取处理,得到特征参数和时序信息;以筛选出的就诊数据所对应的参保人的历史就诊数据作为输入量、以该就诊数据处理得到的特征参数和时序信息作为输出量,采用递归神经网络对所述输入量和所述输出量的取值样本进行训练,得到套项目识别模型。可选地,所述对筛选出的就诊数据进行提取处理,得到特征参数和时序信息包括:对筛选出的就诊数据依次进行数据清洗、分词切片和去除无关用词,得到词条,并对所述词条进行特征提取,得到特征参数;根据所述特征参数在就诊数据中的时间位置,确定特征参数对应的时序信息。可选地,在所述得到套项目识别模型的步骤之后,所述就诊数据异常识别方法还包括:采用K折交叉验证或随机交叉Holdout验证对所述套项目识别模型进行验证,得到验证结果,以供维护人员根据所述验证结果对所述套项目识别模型进行维护或改进。可选地,所述将所述待检测就诊数据导入至所述套项目识别模型进行异常识别,得到识别结果,包括:将所述待检测就诊数据导入至所述套项目识别模型进行异常识别,以得出所述待检测就诊数据的指标值;判断所述指标值是否大于或等于预设标准值;若所述指标值大于或等于预设标准值,则确定所述待检测就诊数据的识别结果为异常;若所述指标值小于预设标准值,则确定所述待检测就诊数据的识别结果为正常。可选地,在所述获取待检测就诊数据,并将所述待检测就诊数据导入至所述套项目识别模型进行异常识别,得到识别结果的步骤之后,所述就诊数据异常识别方法还包括:将所述待检测就诊数据与筛选出的就诊数据进行合并,用以更新所述套项目识别模型的训练样本;根据更新的所述训练样本,对所述套项目识别模型进行进一步的训练,以得到更新的套项目识别模型。可选地,在所述若所述待检测就诊数据的识别结果为异常,则确定所述待检测就诊数据为套项目违规乱收费的步骤之后,所述就诊数据异常识别方法还包括:获取异常的所述待检测就诊数据对应的参保人信息和医疗机构信息;根据所述参保人信息,向参保人下发维权通知;根据所述医疗机构信息,向医疗机构下发违规通知和/或扣费通知。此外,为实现上述目的,本专利技术还提供一种就诊数据异常识别设备,所述就诊数据异常识别设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据异常识别程序,所述数据异常识别程序被所述处理器执行时实现如上述中任一项所述的基于机器学习的就诊数据异常识别方法的步骤。此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有数据异常识别程序,所述数据异常识别程序被处理器执行时实现如上述中任一项所述的基于机器学习的就诊数据异常识别方法的步骤。本专利技术首先通过接收医疗机构采集并上传的参保人的历史就诊数据,并基于预设筛选规则从历史就诊数据中筛选出符合建模的就诊数据;以筛选出的就诊数据作为训练样本,采用机器学习方式,建立套项目识别模型。然后获取待检测就诊数据,并将待检测就诊数据导入至套项目识别模型进行异常识别,得到识别结果,进而识别出就诊数据是否存在异常情况。若识别结果为异常,则确定待检测就诊数据为套项目违规乱收费。本专利技术通过人工智能技术中的机器学习实现数据的智能分析,从而精准有效地识别出可疑的就诊数据,并有效扼制违规的医疗操作,进而提高监管医疗机构的力度,完善监督机制,进而促进医疗质量和医疗健康的可持续发展。附图说明图1为本专利技术实施例方案涉及的就诊数据异常识别设备运行环境的结构示意图;图2为本专利技术基于机器学习的就诊数据异常识别方法一实施例的流程示意图;图3为图2步骤S20一实施例的细化流程示意图;图4为图2步骤S30中将待检测就诊数据导入至套项目识别模型进行异常识别,得到识别结果一实施例的细化流程示意图;图5为本专利技术基于机器学习的就诊数据异常识别方法另一实施例的流程示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。参照图1,图1为本专利技术实施例方案涉及的就诊数据异常识别设备运行环境的结构示意图。本实施例就诊数据异常识别设备可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、服务器等计算机设置。如图1所示,该就诊数据异常识别设备可以包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解,图1中示出的就诊数据异常识别设备的硬件结构并不本文档来自技高网...

【技术保护点】
1.一种基于机器学习的就诊数据异常识别方法,其特征在于,所述就诊数据异常识别方法包括以下步骤:接收医疗机构采集并上传的所有参保人的历史就诊数据,并基于预设筛选规则从所述历史就诊数据中筛选出符合建模的就诊数据;以筛选出的就诊数据作为训练样本,采用机器学习方式,建立套项目识别模型;获取待检测就诊数据,并将所述待检测就诊数据导入至所述套项目识别模型进行异常识别,得到识别结果;若所述待检测就诊数据的识别结果为异常,则确定所述待检测就诊数据为套项目违规乱收费。

【技术特征摘要】
1.一种基于机器学习的就诊数据异常识别方法,其特征在于,所述就诊数据异常识别方法包括以下步骤:接收医疗机构采集并上传的所有参保人的历史就诊数据,并基于预设筛选规则从所述历史就诊数据中筛选出符合建模的就诊数据;以筛选出的就诊数据作为训练样本,采用机器学习方式,建立套项目识别模型;获取待检测就诊数据,并将所述待检测就诊数据导入至所述套项目识别模型进行异常识别,得到识别结果;若所述待检测就诊数据的识别结果为异常,则确定所述待检测就诊数据为套项目违规乱收费。2.如权利要求1所述的就诊数据异常识别方法,其特征在于,所述基于预设筛选规则从所述历史就诊数据中筛选出符合建模的就诊数据,包括:根据所述历史就诊数据的数据内容,剔除不含有检测和理疗的历史就诊数据,其中,所述数据内容至少包括就诊时间、检测项目、检测费用、理疗项目、理疗费用;根据检测项目和/或理疗项目的预设收费标准,判断剔除后剩余的历史就诊数据中是否存在套项目情况,其中,所述套项目情况至少包括将不收费的项目套用在可收费的项目上、将收费低于第一预设阈值的项目套用在收费高于第二预设阈值的项目上中的任一项;若剔除后剩余的历史就诊数据中存在套项目情况,则将历史就诊数据标注为异常就诊数据;若剔除后剩余的历史就诊数据中不存在套项目情况,则将历史就诊数据标注为正常就诊数据;将标注的所述异常就诊数据和所述正常就诊数据作为建模的就诊数据。3.如权利要求1所述的就诊数据异常识别方法,其特征在于,所述以筛选出的就诊数据作为训练样本,采用机器学习方式,建立套项目识别模型,包括:对筛选出的就诊数据进行提取处理,得到特征参数和时序信息;以筛选出的就诊数据所对应的参保人的历史就诊数据作为输入量、以该就诊数据处理得到的特征参数和时序信息作为输出量,采用递归神经网络对所述输入量和所述输出量的取值样本进行训练,得到套项目识别模型。4.如权利要求3所述的就诊数据异常识别方法,其特征在于,所述对筛选出的就诊数据进行提取处理,得到特征参数和时序信息包括:对筛选出的就诊数据依次进行数据清洗、分词切片和去除无关用词,得到词条,并对所述词条进行特征提取,得到特征参数;根据所述特征参数在就诊数据中的时间位置,确定特征参数对应的时序信息。5.如权利要求...

【专利技术属性】
技术研发人员:陈明东黄越胥畅
申请(专利权)人:平安医疗健康管理股份有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1