一种数据标准化处理方法、装置及存储介质制造方法及图纸

技术编号:21184505 阅读:21 留言:0更新日期:2019-05-22 15:06
本发明专利技术实施例公开了一种数据标准化处理方法、装置及存储介质,其中数据标准化处理方法包括:连接医保数据库,并从医保数据库中获取待验证医保数据,待验证医保数据包括多个医保业务字段及其对应的医保业务数据;将待验证医保数据通过预设对应规则进行检验,判断多个医保业务字段与医保业务数据是否按照预设对应规则相互对应;若不对应,则将医保业务数据进行迭代变换,获得完全按照预设对应规则对应的医保数据,作为标准化医保数据。采用本发明专利技术,能够通过建立预设对应规则,使得医保业务字段与医保业务数据根据预设对应规则进行迭代变换,获得与预设对应规则匹配的标准化医保数据,减少医保数据的对应失误率,提升医保数据的标准化程度。

A Data Standardization Processing Method, Device and Storage Media

The embodiment of the invention discloses a data standardization processing method, device and storage medium, in which the data standardization processing method includes: connecting the medical insurance database and obtaining the data to be verified from the medical insurance database; the data to be verified includes multiple medical insurance business fields and corresponding medical insurance business data; and carrying out the data to be verified through preset corresponding rules. To test and determine whether multiple medical insurance business fields and medical insurance business data correspond to each other according to the preset corresponding rules; if not, the medical insurance business data will be iteratively transformed to obtain the medical insurance data corresponding to the preset corresponding rules, which will be used as standardized medical insurance data. By adopting the present invention, the medical insurance business field and the medical insurance business data can be iteratively transformed according to the preset corresponding rules by establishing the preset corresponding rules, and the standardized medical insurance data matching the preset corresponding rules can be obtained, the corresponding error rate of the medical insurance data can be reduced, and the standardization degree of the medical insurance data can be improved.

【技术实现步骤摘要】
一种数据标准化处理方法、装置及存储介质
本专利技术涉及数据处理领域,具体涉及一种数据标准化处理方法、装置及存储介质。
技术介绍
医疗保险属于我国社会保障五大险种之一,医疗保险基金指通过法律或合同的形式,由参加医疗保险的企事业单位、机关团体或个人在事先确定的比例下,缴纳规定数量的医疗保险费汇集而成的、为被保险人提供基本医疗保障的一种货币资金,医疗保险基金的筹集和管理带有强制性,不以营利为目的。正是因为医疗保险的重要性,在很多时候都需要对医保数据进行分析和研究。而医保数据的名目十分丰富,包括报销人信息、涉及疾病、报销政策、和报销金额等,尤其报销金额方面,又包括费用总额、自付金额、自费金额和统筹报销金额。由于种类繁多,如果在获取医保数据进行分析和研究的时候,数据名目与数据内容存在对应失误,将造成研究效率低下、研究成果可信率低的问题,因此,亟待对医保数据进行标准化处理和清洗,以提升数据准确率。
技术实现思路
本专利技术实施例提供一种数据标准化处理方法、装置及存储介质,能够通过建立预设对应规则,使得医保业务字段与医保业务数据根据预设对应规则进行迭代变换,获得与预设对应规则匹配的标准化医保数据,减少医保数据的对应失误率,提升医保数据的标准化程度。本专利技术实施例的第一方面提供了一种数据标准化处理方法,所述数据标准化处理方法包括:连接医保数据库,并从所述医保数据库中获取待验证医保数据,所述待验证医保数据包括多个医保业务字段及其对应的医保业务数据;通过预设对应规则对所述待验证医保数据进行检验,判断所述多个医保业务字段与所述医保业务数据是否按照所述预设对应规则相互对应;若不对应,则将所述医保业务数据进行迭代变换,确定所述医保业务数据与所述多个医保业务字段按照所述预设对应规则相互对应,获得标准化医保数据。在可选的情况下,所述通过预设对应规则对所述待验证医保数据进行检验包括:获取预设对应规则;根据所述预设对应规则获取所述待验证医保数据中的目标医保业务字段及其对应的医保业务数据,通过所述预设对应规则对所述目标医保业务字段对应的医保业务数据进行检验。在可选的情况下,所述获取预设对应规则具体包括:根据所述医保数据库的建立标准,确定所述多个医保业务字段的对应数据类型;获取所述多个医保业务字段中所述对应数据类型为相同的数值类型的至少两个医保业务字段,并设定所述至少两个医保业务字段为关系医保业务字段;获取保报销政策,并根据所述医保报销政策和所述关系医保业务字段确定所述关系医保业务字段对应的医保业务数据之间的规则等式关系,所述规则等式关系用于限定所述医保业务数据之间的数值关系;获取所述规则等式关系作为所述关系医保业务字段之间的预设对应规则。在可选的情况下,所述根据所述医保报销政策和所述关系医保业务字段确定所述关系医保业务字段对应的医保业务数据之间的规则等式关系,包括:从所述医保报销政策中提取与所述关系医保业务字段相关的关键字,确定所述目标医保业务字段之间的业务逻辑;从所述医保数据库中获取除所述待验证医保数据之外的医保数据实验集,所述医保数据实验集包括训练集和验证集;从所述训练集获取多条训练关系医保业务数据,根据所述多条训练关系医保业务数据之间的业务逻辑和数据关系,建立所述关系医保业务字段之间的等式关系,所述等式关系包括和差关系、大小关系或比值关系;从所述验证集获取多条验证关系医保业务数据,根据所述多条验证关系医保业务数据验证所述等式关系是否有效,并根据有效的等式关系数量确定所述等式关系的有效率;若所述有效率小于所述第一预设阈值,则对所述等式关系进行调整,获得新的等式关系,并重新进行验证;若所述匹配率不小于第一预设阈值,则确定所述等式关系为所述关系医保业务数据之间的规则等式关系。在可选的情况下,所述将所述医保业务数据进行迭代变换,获得完全按照所述预设对应规则对应的医保数据包括:S51:获取所述预设对应规则中的k个规则等式关系,将所述k个规则等式按照涉及的约束力从小到大进行排序;S52:将所述医保业务数据按照所述预设对应规则中的第i个规则等式关系进行对应关系变换,获得第i个对应结果,其中i是初始值为1,以1为间隔的递增整数;S53:将所述第i个对应结果按照所述预设对应规则中的第i+1个规则等式关系进行对应关系变换,获得第i+1个对应结果;S54:检测所述第i+1个对应结果是否符合所述第i个规则等式关系,若否,则返回所述第i个对应结果,再次触发所述将所述第i个对应结果按照所述预设对应规则中的第i+1个规则等式关系进行对应关系变换,获得第i+1个对应结果的操作,直到获得的第i+1个对应结果同时符合所述第i个规则等式关系和所述第i+1个规则等式关系,退出迭代;S55:当所述i+1小于k时,将所述i+1作为新的i,执行步骤S54;否则,将获得的所述第i+1个对应结果作为所述完全按照所述预设对应规则对应的医保数据;S56:当步骤S54中的迭代次数大于第一预测阈值时,退出迭代并发出错误提示,所述错误提示用于提示所述医保数据存在数据错误。在可选情况下,所述将所述医保业务数据进行迭代变换,获得完全按照所述预设对应规则对应的医保数据包括:S61:获取所述预设对应规则中的m个规则等式关系,并将所述m个规则等式关系按照涉及的医保业务字段的个数由多到少进行排序;S62:将所述医保业务数据按照所述预设对应规则中的m个规则等式关系依次进行对应关系变换,获得第j个对应结果,其中j是初始值为1,以1为间隔递增的整数;S63:检测所述第j个对应结果是否同时符合所述m个规则等式关系;S64:若是,则获取所述第j个对应结果为所述完全按照所述预设对应规则对应的医保数据;S65:若否,则根据所述第j个对应结果不符合的所述规则等式关系,对所述第j个对应结果进行最小单位的对应关系变换,获得第j+1个对应结果;S66:将所述j+1作为新的j,执行步骤S63;S67:当步骤S63中的所述j大于第二预设阈值时,发出错误提示,用于提示所述医保数据存在数据错误。在可选情况下,所述将所述医保业务数据进行迭代变换,获得完全按照所述预设对应规则对应的医保数据还还包括:检测所述医保业务字段是否存在空值;若是,则将所述医保业务数据进行迭代变换;当获得的第r个对应结果满足所述预设对应规则中的k个规则等式关系或m个规则等式关系的规则等式关系个数最大时,获取所述第r个对应结果为所述完全按照所述预设对应规则对应的医保数据。本专利技术实施例的第二方面提供了一种数据标准化处理装置,所述数据标准化处理装置包括:获取单元,用于连接医保数据库,并从所述医保数据库中获取待验证医保数据,所述待验证医保数据包括多个医保业务字段及其对应的医保业务数据;判断单元,用于通过预设对应规则对所述待验证医保数据进行检验,判断所述多个医保业务字段与所述医保业务数据是否按照所述预设对应规则相互对应;标准化单元,用于若不对应,则将所述医保业务数据进行迭代变换,确定所述医保业务数据与所述多个医保业务字段按照所述预设对应规则相互对应,获得标准化医保数据。本专利技术实施例第三方面提供了一种电子装置,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行第一方面任一方法中的步骤的指本文档来自技高网...

【技术保护点】
1.一种数据标准化处理方法,其特征在于,所述方法包括:连接医保数据库,并从所述医保数据库中获取待验证医保数据,所述待验证医保数据包括多个医保业务字段及其对应的医保业务数据;通过预设对应规则对所述待验证医保数据进行检验,判断所述多个医保业务字段与所述医保业务数据是否按照所述预设对应规则相互对应;若不对应,则将所述医保业务数据进行迭代变换,获得完全按照所述预设对应规则对应的医保数据,作为标准化医保数据。

【技术特征摘要】
1.一种数据标准化处理方法,其特征在于,所述方法包括:连接医保数据库,并从所述医保数据库中获取待验证医保数据,所述待验证医保数据包括多个医保业务字段及其对应的医保业务数据;通过预设对应规则对所述待验证医保数据进行检验,判断所述多个医保业务字段与所述医保业务数据是否按照所述预设对应规则相互对应;若不对应,则将所述医保业务数据进行迭代变换,获得完全按照所述预设对应规则对应的医保数据,作为标准化医保数据。2.根据权利要求1所述的方法,其特征在于,所述通过预设对应规则对所述待验证医保数据进行检验包括:获取预设对应规则;根据所述预设对应规则获取所述待验证医保数据中的目标医保业务字段及其对应的医保业务数据,通过所述预设对应规则对所述目标医保业务字段对应的医保业务数据进行检验。3.根据权利要求2所述的方法,其特征在于,所述获取预设对应规则具体包括:根据所述医保数据库的建立标准,确定所述多个医保业务字段的对应数据类型;获取所述多个医保业务字段中所述对应数据类型为相同的数值类型的至少两个医保业务字段,并设定所述至少两个医保业务字段为关系医保业务字段;获取医保报销政策,并根据所述医保报销政策和所述关系医保业务字段确定所述关系医保业务字段对应的医保业务数据之间的规则等式关系,所述规则等式关系用于限定所述医保业务数据之间的数值关系;获取所述规则等式关系作为所述关系医保业务字段之间的预设对应规则。4.根据权利要求3所述的方法,其特征在于,所述根据所述医保报销政策和所述关系医保业务字段确定所述关系医保业务字段对应的医保业务数据之间的规则等式关系,包括:从所述医保报销政策中提取与所述关系医保业务字段相关的关键字,确定所述目标医保业务字段之间的业务逻辑;从所述医保数据库中获取除所述待验证医保数据之外的医保数据实验集,所述医保数据实验集包括训练集和验证集;从所述训练集获取多条训练关系医保业务数据,根据所述多条训练关系医保业务数据之间的业务逻辑和数据关系,建立所述关系医保业务字段之间的等式关系,所述等式关系包括和差关系、大小关系或比值关系;从所述验证集获取多条验证关系医保业务数据,根据所述多条验证关系医保业务数据验证所述等式关系是否有效,并根据有效的等式关系数量确定所述等式关系的有效率;若所述有效率小于所述第一预设阈值,则对所述等式关系进行调整,获得新的等式关系,并重新进行验证;若所述匹配率不小于第一预设阈值,则确定所述等式关系为所述关系医保业务数据之间的规则等式关系。5.根据权利要求4所述的方法,其特征在于,所述将所述医保业务数据进行迭代变换,获得完全按照所述预设对应规则对应的医保数据包括:S51:获取所述预设对应规则中的k个规则等式关系,将所述k个规则等式按照涉及的约束力从小到大进行排序;S52:将所述医保业务数据按照所述预设对应规则中的第i个规则等式关系进行对应关系变换,获得第i个对应结果,其中i是初始值为1,以1为间隔的递增整数;S53:将所述第i个对应结果按照所述预设对应规则中的第i+1个规则等式关系进行对应关系变换,获得第i+1个对应结果;S54:检测所述第...

【专利技术属性】
技术研发人员:王岭峻姚致君左浩
申请(专利权)人:平安医疗健康管理股份有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1