The invention discloses a method of data processing, the method comprises the steps of: medical insurance institutions and the original data acquisition database at all levels of medical institutions; establish the classification model, natural semantic model, grasping the semi supervised learning model and identity information capture model; and the original data input to the classification model, the natural semantic capture model semi supervised learning model, and identity information capture model, the model of the original input data analysis output illegal documents. Through the method, we can quickly and batch extract the illegal documents for controlling drugs in different areas, which greatly reduces labor costs and greatly improves efficiency.
【技术实现步骤摘要】
数据处理的方法、数据处理的装置及计算机可读存储介质
本专利技术涉及数据处理领域,尤其涉及数据处理的方法、数据处理的装置及计算机可读存储介质。
技术介绍
众所周知,医院等医疗机构对于治疗一些疾病的药物有很多的管控措施,这些管控药物对于治疗对应的疾病必不可少,但是却存在很多问题,比如用量、用法如果不适当会造成一定的危害,不同程度的患病者对于药物的需求量是不一样的。目前医保政策下限定性胰岛素使用已经有比较明确的业务逻辑,但具体落实到每个城市、地区、医疗机构存在各种困难。传统的违规单据提取方法是业务专家对过去一年的全量数据挨个排查,最终定位出违规单据信息,消耗大量时间,且这样排查不是每个人员都可以操作(限定在业务专家)。且,若没有足够数量、违规金额的违规单据,医保机构并不会直接采纳提取结果。更麻烦的是,在切换不同城市之后又要重复相同劳动,效率太低。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种数据处理方法、数据处理的装置及计算机可读存储介质,针对不同地区快速、批量提取管控药物的违规地单据,大量减少了人工成本并极大的提高了效率。为实现上述目的,本专利技术提供一种数据处理的方法,该方法包括步骤:获取保险机构数据库及各级医疗机构的医疗原始数据,建立分类模型、自然语义抓取模型、半监督学习模型及身份信息抓取模型;及将所述原始数据输入所述分类模型、自然语义抓取模型、半监督学习模型及身份信息抓取模型,各模型对输入的所述原始数据进行分析输出违规单据;其中,所述分类模型对所述医疗原始数据进行分类,并对所述医疗原始数据中的误诊病例进行纠正使得所述误诊病例被正确分类。优选地,所述分 ...
【技术保护点】
一种数据处理的方法,其特征在于,该方法包括步骤:获取保险机构数据库及各级医疗机构的医疗原始数据,建立分类模型、自然语义抓取模型、半监督学习模型及身份信息抓取模型;及将所述原始数据输入所述分类模型、自然语义抓取模型、半监督学习模型及身份信息抓取模型,各模型对输入的所述原始数据进行分析输出违规单据;其中,所述分类模型对所述医疗原始数据进行分类,并对所述医疗原始数据中的误诊病例进行纠正使得所述误诊病例被正确分类。
【技术特征摘要】
1.一种数据处理的方法,其特征在于,该方法包括步骤:获取保险机构数据库及各级医疗机构的医疗原始数据,建立分类模型、自然语义抓取模型、半监督学习模型及身份信息抓取模型;及将所述原始数据输入所述分类模型、自然语义抓取模型、半监督学习模型及身份信息抓取模型,各模型对输入的所述原始数据进行分析输出违规单据;其中,所述分类模型对所述医疗原始数据进行分类,并对所述医疗原始数据中的误诊病例进行纠正使得所述误诊病例被正确分类。2.如权利要求1所述的数据处理的方法,其特征在于,所述分类原始数据包括医保保单、收费单据、报销单据。3.如权利要求1所述的数据处理的方法,其特征在于,所述分类模型包括决策树分类器、选择树分类器其中之一。4.如权利要求3所述的数据处理的方法,其特征在于,所述分类模型的建立包括以下步骤:选定样本,将所有样本分成训练样本和测试样本两部分;在所述训练样本上执行分类器算法,生成所述分类模型;在所述测试样本上执行所述分类模型,生成预测结果;及根据所述预测结果,计算必要的评估指标,评估所述分类模型的性能。5.如权利要求1所述的数据处理的方法,其特征在于,所述自然语义模型是基于自然语义处理而建立的用于抓取特定字段的模型,所述身份信息抓取模型主要用于获得原始数据中药物使用者的身份信息。6.如权利要求1所述的数据处理的方法,其特征在于,所述半监督学习模型的建立包括以下步骤:对于少量有标记数据和大量未标记数据,随机初始化多个半监督分类器;对于每个...
【专利技术属性】
技术研发人员:周瑜,阮晓雯,徐亮,肖京,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。