The embodiment of the invention discloses a data standardization processing method, device and storage medium, in which the data standardization processing method includes: connecting the medical insurance database and obtaining the data to be verified from the medical insurance database; the data to be verified includes multiple medical insurance business fields and corresponding medical insurance business data; and carrying out the data to be verified through preset corresponding rules. To test and determine whether multiple medical insurance business fields and medical insurance business data correspond to each other according to the preset corresponding rules; if not, the medical insurance business data will be iteratively transformed to obtain the medical insurance data corresponding to the preset corresponding rules, which will be used as standardized medical insurance data. By adopting the present invention, the medical insurance business field and the medical insurance business data can be iteratively transformed according to the preset corresponding rules by establishing the preset corresponding rules, and the standardized medical insurance data matching the preset corresponding rules can be obtained, the corresponding error rate of the medical insurance data can be reduced, and the standardization degree of the medical insurance data can be improved.
【技术实现步骤摘要】
一种数据标准化处理方法、装置及存储介质
本专利技术涉及数据处理领域,具体涉及一种数据标准化处理方法、装置及存储介质。
技术介绍
医疗保险属于我国社会保障五大险种之一,医疗保险基金指通过法律或合同的形式,由参加医疗保险的企事业单位、机关团体或个人在事先确定的比例下,缴纳规定数量的医疗保险费汇集而成的、为被保险人提供基本医疗保障的一种货币资金,医疗保险基金的筹集和管理带有强制性,不以营利为目的。正是因为医疗保险的重要性,在很多时候都需要对医保数据进行分析和研究。而医保数据的名目十分丰富,包括报销人信息、涉及疾病、报销政策、和报销金额等,尤其报销金额方面,又包括费用总额、自付金额、自费金额和统筹报销金额。由于种类繁多,如果在获取医保数据进行分析和研究的时候,数据名目与数据内容存在对应失误,将造成研究效率低下、研究成果可信率低的问题,因此,亟待对医保数据进行标准化处理和清洗,以提升数据准确率。
技术实现思路
本专利技术实施例提供一种数据标准化处理方法、装置及存储介质,能够通过建立预设对应规则,使得医保业务字段与医保业务数据根据预设对应规则进行迭代变换,获得与预设对应规则匹配的标准化医保数据,减少医保数据的对应失误率,提升医保数据的标准化程度。本专利技术实施例的第一方面提供了一种数据标准化处理方法,所述数据标准化处理方法包括:连接医保数据库,并从所述医保数据库中获取待验证医保数据,所述待验证医保数据包括多个医保业务字段及其对应的医保业务数据;通过预设对应规则对所述待验证医保数据进行检验,判断所述多个医保业务字段与所述医保业务数据是否按照所述预设对应规则相互对应;若不对应 ...
【技术保护点】
1.一种数据标准化处理方法,其特征在于,所述方法包括:连接医保数据库,并从所述医保数据库中获取待验证医保数据,所述待验证医保数据包括多个医保业务字段及其对应的医保业务数据;通过预设对应规则对所述待验证医保数据进行检验,判断所述多个医保业务字段与所述医保业务数据是否按照所述预设对应规则相互对应;若不对应,则将所述医保业务数据进行迭代变换,获得完全按照所述预设对应规则对应的医保数据,作为标准化医保数据。
【技术特征摘要】
1.一种数据标准化处理方法,其特征在于,所述方法包括:连接医保数据库,并从所述医保数据库中获取待验证医保数据,所述待验证医保数据包括多个医保业务字段及其对应的医保业务数据;通过预设对应规则对所述待验证医保数据进行检验,判断所述多个医保业务字段与所述医保业务数据是否按照所述预设对应规则相互对应;若不对应,则将所述医保业务数据进行迭代变换,获得完全按照所述预设对应规则对应的医保数据,作为标准化医保数据。2.根据权利要求1所述的方法,其特征在于,所述通过预设对应规则对所述待验证医保数据进行检验包括:获取预设对应规则;根据所述预设对应规则获取所述待验证医保数据中的目标医保业务字段及其对应的医保业务数据,通过所述预设对应规则对所述目标医保业务字段对应的医保业务数据进行检验。3.根据权利要求2所述的方法,其特征在于,所述获取预设对应规则具体包括:根据所述医保数据库的建立标准,确定所述多个医保业务字段的对应数据类型;获取所述多个医保业务字段中所述对应数据类型为相同的数值类型的至少两个医保业务字段,并设定所述至少两个医保业务字段为关系医保业务字段;获取医保报销政策,并根据所述医保报销政策和所述关系医保业务字段确定所述关系医保业务字段对应的医保业务数据之间的规则等式关系,所述规则等式关系用于限定所述医保业务数据之间的数值关系;获取所述规则等式关系作为所述关系医保业务字段之间的预设对应规则。4.根据权利要求3所述的方法,其特征在于,所述根据所述医保报销政策和所述关系医保业务字段确定所述关系医保业务字段对应的医保业务数据之间的规则等式关系,包括:从所述医保报销政策中提取与所述关系医保业务字段相关的关键字,确定所述目标医保业务字段之间的业务逻辑;从所述医保数据库中获取除所述待验证医保数据之外的医保数据实验集,所述医保数据实验集包括训练集和验证集;从所述训练集获取多条训练关系医保业务数据,根据所述多条训练关系医保业务数据之间的业务逻辑和数据关系,建立所述关系医保业务字段之间的等式关系,所述等式关系包括和差关系、大小关系或比值关系;从所述验证集获取多条验证关系医保业务数据,根据所述多条验证关系医保业务数据验证所述等式关系是否有效,并根据有效的等式关系数量确定所述等式关系的有效率;若所述有效率小于所述第一预设阈值,则对所述等式关系进行调整,获得新的等式关系,并重新进行验证;若所述匹配率不小于第一预设阈值,则确定所述等式关系为所述关系医保业务数据之间的规则等式关系。5.根据权利要求4所述的方法,其特征在于,所述将所述医保业务数据进行迭代变换,获得完全按照所述预设对应规则对应的医保数据包括:S51:获取所述预设对应规则中的k个规则等式关系,将所述k个规则等式按照涉及的约束力从小到大进行排序;S52:将所述医保业务数据按照所述预设对应规则中的第i个规则等式关系进行对应关系变换,获得第i个对应结果,其中i是初始值为1,以1为间隔的递增整数;S53:将所述第i个对应结果按照所述预设对应规则中的第i+1个规则等式关系进行对应关系变换,获得第i+1个对应结果;S54:检测所述第...
【专利技术属性】
技术研发人员:王岭峻,姚致君,左浩,
申请(专利权)人:平安医疗健康管理股份有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。