数据标准化处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:20074907 阅读:49 留言:0更新日期:2019-01-15 00:35
本申请涉及一种基于数据资源的数据标准化处理方法、装置、计算机设备和存储介质。所述方法包括:获取初始表,初始表中包括了初始数据;从初始表中提取所述初始数据的关键字段;获取初始表与标准表之间的映射关系;标准表中包括了标准字段;根据映射关系,将关键字段转换为标准字段;利用转换后的多个标准字段生成与初始表对应的标准化表。采用本方法能够实现多个地区内的数据之间的标准化,并为不同地区的数据更新以及整理等提供了方便。

Data Standardization Processing Method, Device, Computer Equipment and Storage Media

This application relates to a data standardization processing method, device, computer equipment and storage medium based on data resources. The method includes: obtaining the initial table, which includes the initial data; extracting the key fields of the initial data from the initial table; obtaining the mapping relationship between the initial table and the standard table; including the standard fields in the standard table; converting the key fields into the standard fields according to the mapping relationship; and generating the corresponding standards with the initial table by using the converted standard fields. Chemical tables. This method can realize the standardization of data in different regions, and provide convenience for data updating and sorting in different regions.

【技术实现步骤摘要】
数据标准化处理方法、装置、计算机设备和存储介质
本申请涉及数据处理
,特别是涉及一种数据标准化处理方法、装置、计算机设备和存储介质。
技术介绍
现有医疗数据和保险数据中,各个城市的表结构、字段、同一字段的取值情况并不一致。例如,有些参保保险类型是以静态形式提供,通过从数据库中直接获取已有的参保保险类型,有些城市参保保险类型是以动态形式提供的,通过从数据库中实时采集不断更新的参保保险类型,参保人员的保险类型有多个不同的对应参保区间,因此,为了提高对多个地区的医疗数据和保险数据的获取和同步的效率,,需要提供可实现多个地区不同医疗数据和保险数据之间的统一方法。在传统的数据标准化中,通常是利用基于医术术语字典的双向最大匹配分词算法,对医疗文本数据进行分词,得到结构化数据,简单实现医疗数据结构标准化。但由于不同地区的医疗数据之间的存在差异数据,不仅仅限于数据结构差异,还包括不同数据的字段差异和取值差异,而且传统的数据标准化方法中,也未涉及与保险理赔数据相关的统一方法,因此并不适用于多个地区中医疗数据和保险数据之间实现标准化。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够实现多个本文档来自技高网...

【技术保护点】
1.一种数据标准化处理方法,所述方法包括:获取初始表,所述初始表中包括了初始数据;从所述初始表中提取所述初始数据的关键字段;获取所述初始表与标准表之间的映射关系;所述标准表中包括了标准字段;根据所述映射关系,将所述关键字段转换为标准字段;利用转换后的多个标准字段生成与所述初始表对应的标准化表。

【技术特征摘要】
1.一种数据标准化处理方法,所述方法包括:获取初始表,所述初始表中包括了初始数据;从所述初始表中提取所述初始数据的关键字段;获取所述初始表与标准表之间的映射关系;所述标准表中包括了标准字段;根据所述映射关系,将所述关键字段转换为标准字段;利用转换后的多个标准字段生成与所述初始表对应的标准化表。2.根据权利要求1所述的方法,其特征在于,在所述获取初始表之前,还包括:建立与第三方数据库的连接;从所述第三方数据库获取所述初始表,将所述初始表标记为原始表;利用所述原始表对所述初始表进行初始校验;当通过初始校验时,对所述初始表中的多个关键字段进行完整性校验。3.根据权利要求1所述的方法,其特征在于,所述关键字段包括用户标识;所述方法还包括:获取所述标准化表对应的类型,所述类型包括医疗类型和理赔类型;根据用户标识获取对应的医疗类型的标准化表以及理赔类型的标准化表;将所述医疗类型的标准化表以及理赔类型的标准化表进行交叉验证,识别医疗类型的标准化表以及理赔类型的标准化表之间的差异数据。4.根据权利要求1至3任意一项所述的方法,其特征在于,在所述获取所述初始表与标准表之间的映射关系之前,所述方法还包括:获取所述初始表中的主键和外键,并获取所述主键和所述外键之间的对应关系;获取所述标准表中的主键和外键,并获取所述主键和所述外键之间的对应关系;根据所述初始表中的主键和所述标准表的主键,建立所述初始表和所述标准表间的映射关系;根据所述初始表中的外键、所述主键和所述外键间的对应关系,以及所述标准表中的外键、所述主键和所述外键间的对应关系,建立所述关键字段和所述标准字段之间的映射关系。5.根据权利要求1至3任意一项所述的方法,其特征在于,所述方法还包括:当所述标准表中无与关键字段对应的标准字段...

【专利技术属性】
技术研发人员:陈源冯骞郑毅
申请(专利权)人:平安医疗健康管理股份有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1