基于机器学习的就诊数据异常识别方法、设备及存储介质技术

技术编号:20922187 阅读:25 留言:0更新日期:2019-04-20 10:54
本发明专利技术公开了一种基于机器学习的就诊数据异常识别方法,包括:接收医疗机构采集并上传的参保人的历史就诊数据,并以预设的中医理疗项目为关键字,从所述历史就诊数据中筛选出含有所述中医理疗项目的就诊数据;以筛选出的就诊数据作为训练样本,采用机器学习方式,建立中医就诊异常模型;获取待检测就诊数据,并将所述待检测就诊数据导入至所述中医就诊异常模型进行异常识别,得到识别结果;若所述待检测就诊数据的识别结果为异常,则确定所述待检测就诊数据为中医项目过度医疗。本发明专利技术还公开了一种设备及存储介质。本发明专利技术通过人工智能技术中的机器学习实现数据的智能分析,从而精准有效地识别出可疑的就诊数据,并有效扼制违规的医疗操作。

Abnormal Recognition Method, Equipment and Storage Medium of Medical Data Based on Machine Learning

The invention discloses an anomaly recognition method for medical treatment data based on machine learning, which includes: receiving the historical medical treatment data collected and uploaded by medical institutions, and selecting the medical treatment data containing the traditional Chinese medicine physical treatment items from the historical medical treatment data with the preset Chinese medicine physical treatment items as keywords; using the selected medical treatment data as training samples, and adopting the machine. The machine learning method establishes the abnormal model of TCM consultation, obtains the data to be detected, and imports the data to the abnormal model of TCM consultation, and obtains the recognition result. If the recognition result of the data to be detected is abnormal, the data to be detected is determined to be excessive medical treatment of TCM project. The invention also discloses a device and a storage medium. The invention realizes intelligent analysis of data by machine learning in artificial intelligence technology, thereby accurately and effectively identifying suspicious medical data and effectively restraining illegal medical operations.

【技术实现步骤摘要】
基于机器学习的就诊数据异常识别方法、设备及存储介质
本专利技术涉及数据处理
,尤其涉及一种基于机器学习的就诊数据异常识别方法、设备及存储介质。
技术介绍
社会医疗保险是国家和社会根据一定的法律法规,为向保障范围内的劳动者提供患病时基本医疗需求保障而建立的社会保险制度。目前,医疗服务机构分布广泛,为参保人员提供更为便民的医疗服务,然而在利益的驱动下,一些机构出现乱检查、乱开药、重复就诊重复开药、乱收费用等违规操作,浪费了本就有限的医疗资源,同时还损害了参保人员的合法利益,进而不利于医疗质量和医疗健康的可持续发展。
技术实现思路
本专利技术的主要目的在于提供一种基于机器学习的就诊数据异常识别方法、设备及存储介质,旨在解决如何精准有效地识别出可疑的就诊数据,从而有效扼制违规的医疗操作的技术问题。为实现上述目的,本专利技术提供的一种基于机器学习的就诊数据异常识别方法,所述就诊数据异常识别方法包括以下步骤:接收医疗机构采集并上传的参保人的历史就诊数据,并以预设的中医理疗项目为关键字,从所述历史就诊数据中筛选出含有所述中医理疗项目的就诊数据;以筛选出的就诊数据作为训练样本,采用机器学习方式,建立中医就诊异常模型;获取待检测就诊数据,并将所述待检测就诊数据导入至所述中医就诊异常模型进行异常识别,得到识别结果;若所述待检测就诊数据的识别结果为异常,则确定所述待检测就诊数据为中医项目过度医疗。可选地,所述以预设的中医理疗项目为关键字,从所述历史就诊数据中筛选出含有所述中医理疗项目的就诊数据,包括:根据所述历史就诊数据的数据内容,并以中医理疗项目为关键字,剔除不含有所述中医理疗项目的历史就诊数据,其中,所述数据内容至少包括就诊时间、就诊症状、理疗项目和理疗费用;根据剩余的历史就诊数据中的就诊时间和中医理疗项目,统计得到单日中医理疗次数和月中医理疗次数;判断历史就诊数据的单日中医理疗次数和/或月中医理疗次数是否大于或等于预设阈值;若历史就诊数据的单日中医理疗次数和/或月中医理疗次数大于或等于预设阈值,则将历史就诊数据标注为异常就诊数据;若历史就诊数据的单日中医理疗次数和/或月中医理疗次数小于预设阈值,则将历史就诊数据标注为正常就诊数据;将标注的所述异常就诊数据和所述正常就诊数据合并,得到就诊数据。可选地,所述以筛选出的就诊数据作为训练样本,采用机器学习方式,建立中医就诊异常模型包括:对筛选出的就诊数据进行提取处理,得到特征参数和时序信息;以筛选出的就诊数据所对应的参保人的历史就诊数据作为输入量、以该就诊数据处理得到的特征参数和时序信息作为输出量,采用递归神经网络对所述输入量和所述输出量的取值样本进行训练,得到中医就诊异常模型。可选地,所述对筛选出的就诊数据进行提取处理,得到特征参数和时序信息包括:对筛选出的就诊数据依次进行数据清洗、分词切片和去除无关用词,得到词条,并对所述词条进行特征提取,得到特征参数;根据所述特征参数在就诊数据中的时间位置,确定特征参数对应的时序信息。可选地,在所述得到中医就诊异常模型的操作之后,所述就诊数据异常识别方法还包括:采用K折交叉验证或随机交叉Holdout验证对所述中医就诊异常模型进行验证,得到验证结果,以供维护人员根据所述验证结果对所述中医就诊异常模型进行维护或改进。可选地,所述将所述待检测就诊数据导入至所述中医就诊异常模型进行异常识别,得到识别结果包括:将所述待检测就诊数据导入至所述中医就诊异常模型进行异常识别,以得出所述待检测就诊数据的指标值;判断所述指标值是否大于或等于预设标准值;若所述指标值大于或等于预设标准值,则确定所述待检测就诊数据的识别结果为异常;若所述指标值小于预设标准值,则确定所述待检测就诊数据的识别结果为正常。可选地,在所述获取待检测就诊数据,并将所述待检测就诊数据导入至所述中医就诊异常模型进行异常识别,得到识别结果的操作之后,所述就诊数据异常识别方法还包括:将所述待检测就诊数据与筛选出的就诊数据进行合并,用以更新所述中医就诊异常模型的训练样本;根据更新的所述训练样本,对所述中医就诊异常模型进行进一步的训练,以得到更新的中医就诊异常模型。可选地,在所述若所述待检测就诊数据的识别结果为异常,则确定所述待检测就诊数据为中医项目过度医疗的操作之后,所述就诊数据异常识别方法还包括:获取异常的所述待检测就诊数据对应的参保人信息和医疗机构信息;根据所述参保人信息,向参保人下发维权通知;根据所述医疗机构信息,向医疗机构下发违规通知和/或扣费通知。此外,为实现上述目的,本专利技术还提供一种就诊数据异常识别设备,所述就诊数据异常识别设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的数据异常识别程序,所述数据异常识别程序被所述处理器执行时实现如上述中任一项所述的基于机器学习的就诊数据异常识别方法的步骤。此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有数据异常识别程序,所述数据异常识别程序被处理器执行时实现如上述中任一项所述的基于机器学习的就诊数据异常识别方法的步骤。本专利技术首先通过接收医疗机构采集并上传的参保人的历史就诊数据,并以预设的中医理疗项目为关键字,从所述历史就诊数据中筛选出含有所述中医理疗项目的就诊数据;以筛选出的就诊数据作为训练样本,采用机器学习方式,建立中医就诊异常模型。然后获取待检测就诊数据,并将待检测就诊数据导入至中医就诊异常模型进行异常识别,得到识别结果,进而识别出就诊数据是否存在异常情况。若识别结果为异常,则确定待检测就诊数据为中医项目过度医疗。本专利技术通过人工智能技术中的机器学习实现数据的智能分析,从而精准有效地识别出可疑的就诊数据,并有效扼制违规的医疗操作,进而提高监管医疗机构的力度,完善监督机制,进而促进医疗质量和医疗健康的可持续发展。附图说明图1为本专利技术实施例方案涉及的就诊数据异常识别设备运行环境的结构示意图;图2为本专利技术基于机器学习的就诊数据异常识别方法一实施例的流程示意图;图3为图2步骤S20一实施例的细化流程示意图;图4为图2步骤S30中将待检测就诊数据导入至中医就诊异常模型进行异常识别,得到识别结果一实施例的细化流程示意图;图5为本专利技术基于机器学习的就诊数据异常识别方法另一实施例的流程示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。参照图1,图1为本专利技术实施例方案涉及的就诊数据异常识别设备运行环境的结构示意图。本实施例就诊数据异常识别设备可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、服务器等计算机设置。如图1所示,该就诊数据异常识别设备可以包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选本文档来自技高网...

【技术保护点】
1.一种基于机器学习的就诊数据异常识别方法,其特征在于,所述就诊数据异常识别方法包括以下步骤:接收医疗机构采集并上传的参保人的历史就诊数据,并以预设的中医理疗项目为关键字,从所述历史就诊数据中筛选出含有所述中医理疗项目的就诊数据;以筛选出的就诊数据作为训练样本,采用机器学习方式,建立中医就诊异常模型;获取待检测就诊数据,并将所述待检测就诊数据导入至所述中医就诊异常模型进行异常识别,得到识别结果;若所述待检测就诊数据的识别结果为异常,则确定所述待检测就诊数据为中医项目过度医疗。

【技术特征摘要】
1.一种基于机器学习的就诊数据异常识别方法,其特征在于,所述就诊数据异常识别方法包括以下步骤:接收医疗机构采集并上传的参保人的历史就诊数据,并以预设的中医理疗项目为关键字,从所述历史就诊数据中筛选出含有所述中医理疗项目的就诊数据;以筛选出的就诊数据作为训练样本,采用机器学习方式,建立中医就诊异常模型;获取待检测就诊数据,并将所述待检测就诊数据导入至所述中医就诊异常模型进行异常识别,得到识别结果;若所述待检测就诊数据的识别结果为异常,则确定所述待检测就诊数据为中医项目过度医疗。2.如权利要求1所述的就诊数据异常识别方法,其特征在于,所述以中医理疗项目为关键字,从所述历史就诊数据中筛选出含有所述中医理疗项目的就诊数据,包括:根据所述历史就诊数据的数据内容,并以预设的中医理疗项目为关键字,剔除不含有所述中医理疗项目的历史就诊数据,其中,所述数据内容至少包括就诊时间、就诊症状、理疗项目和理疗费用;根据剩余的历史就诊数据中的就诊时间和中医理疗项目,统计得到单日中医理疗次数和月中医理疗次数;判断历史就诊数据的单日中医理疗次数和/或月中医理疗次数是否大于或等于预设阈值;若历史就诊数据的单日中医理疗次数和/或月中医理疗次数大于或等于预设阈值,则将历史就诊数据标注为异常就诊数据;若历史就诊数据的单日中医理疗次数和/或月中医理疗次数小于预设阈值,则将历史就诊数据标注为正常就诊数据;将标注的所述异常就诊数据和所述正常就诊数据合并,得到就诊数据。3.如权利要求1所述的就诊数据异常识别方法,其特征在于,所述以筛选出的就诊数据作为训练样本,采用机器学习方式,建立中医就诊异常模型包括:对筛选出的就诊数据进行提取处理,得到特征参数和时序信息;以筛选出的就诊数据所对应的参保人的历史就诊数据作为输入量、以该就诊数据处理得到的特征参数和时序信息作为输出量,采用递归神经网络对所述输入量和所述输出量的取值样本进行训练,得到中医就诊异常模型。4.如权利要求3所述的就诊数据异常识别方法,其特征在于,所述对筛选出的就诊数据进行提取处理,得到特征参数和时序信息包括:对筛选出的就诊数据依次进行数据清洗、分词切片和去除无关用词,得到词条,并对所述词条进行特征提取,得到特征参数;根据所述特征参数在就诊数据中的时间位置,确定特征参数对应的...

【专利技术属性】
技术研发人员:陈明东黄越胥畅
申请(专利权)人:平安医疗健康管理股份有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1