一种医疗数据字典自动标准化的方法与系统技术方案

技术编号:13378450 阅读:53 留言:0更新日期:2016-07-21 07:25
本发明专利技术公开了一种医疗数据字典自动标准化的方法与系统,方法包括以下步骤:S1:本地客户端向云计算端上传未知标准符合性的数据字典;S2:云计算端将上传的未知标准符合性的数据字典与中心标准字典进行匹配,自动建立两个字典之间的对应关系;S3:云计算端形成标准化的对应关系文件;S4:云计算端将标准化的对应关系文件下发至本地客户端,本地客户端通过标准化的对应关系文件对本地数据进行标准化。本发明专利技术采用基于云服务的方式,对各厂商或者医院的非标准数据字典进行标准化操作,各厂商或者医院的本地客户端将非标准数据字典上传至云计算端,云计算端自动进行匹配,并将标准化的对应关系文件发送至本地客户端,本地客户端就可以在本地进行标准化,方便快捷。

【技术实现步骤摘要】


本专利技术涉及医疗数据处理
,尤其涉及一种医疗数据字典自动标准化的方法与系统

技术介绍

数据字典是指对数据的数据项、数据结构、数据流、数据存储、处理逻辑、外部实体等进行定义和描述,其目的是对数据流程图中的各个元素做出详细的说明。数据字典是一种用户可以访问的记录数据库和应用程序元数据的目录。主动数据字典是指在对数据库或应用程序结构进行修改时,其内容可以由DBMS自动更新的数据字典。被动数据字典是指修改时必须手工更新其内容的数据字典。
在医疗数据的使用过程中,各个厂商或者医院采样不同的系统进行医疗数据的处理,但是由于不同的系统会造成数据无法进行交互;因此需要对数据字典内容进行标准化处理,即将各个厂商或者医院的非标准的医疗数据根据标准要求映射成标准值。
通常,该处理过程需要根据实际业务情况来进行手工配置,手工配置方式匹配效率低、匹配错误率高、工作量大,在实际业务数据匹配构建过程中无法根据实际情况进行快速构建。因此,需要一种可靠性高的医疗数据字典标准化方法与系统,而无需手工重新对照映射。

技术实现思路

本专利技术的目的在于克服现有技术的不足,提供一种医疗数据字典自动标准化的方法与系统,实现在云计算端自动进行非标准数据字典的标准化,可靠性高。
本专利技术的目的是通过以下技术方案来实现的:一种医疗数据字典自动标准化的方法,包括以下步骤:
S1:本地客户端向云计算端上传未知标准符合性的数据字典;
S2:云计算端将上传的未知标准符合性的数据字典与中心标准字典进行匹配,自动建立两个字典之间的对应关系;
S3:云计算端形成标准化的对应关系文件;
S4:云计算端将标准化的对应关系文件下发至本地客户端,本地客户端通过标准化的对应关系文件对本地数据进行标准化。
所述的中心标准字典包括标准字段值域字典,在进行匹配的时候采用值域匹配知识库和字段语义知识库。
所述的步骤S2包括以下子步骤:
S201:云计算端解析文件至数据源字段;
S202:调取标准字段值域字典;
S203:将数据源字段进行值域校验,判断字段是否标准:若判断结果发现字段中有不标准部分则进入步骤S204,否则进入步骤S208;
S204:对不标准部分的字段进行分类并归类;
S205:调用值域匹配知识库,判断知识库是否能匹配不标准部分的字段:若判断为能完全匹配则进入步骤S207,否则进入步骤S206;
S206:对无法进行值域匹配知识库匹配的部分,发送至本地客户端,用户通过本地客户端自主进行字段值域修改,并将结果发送回云计算端,返回步骤S203;
S207:自动建立可识别字段值域标准化规则;
S208:调用字段语义知识库,判断是否能自动识别语义匹配字段:如果可以自动匹配字段,进入步骤S209,否则进入步骤S210;
S209:生成中心字典标准化映射方法,进入步骤S211;
S210:对无法自动匹配字段的部分,发送至本地客户端,用户通过本地客户端进自行映射,并将结果发送回云计算端,返回步骤S208;对于可以自动匹配字段的部分,云计算端对中心标准字典进行更新;
S211:整合标准化映射方法包。
一种医疗数据字典自动标准化的方法还包括一个用户登录步骤S0,包括以下子步骤:
S01:用户通过本地客户端登陆,建立与云计算端的连接关系;
S02:用户选择建立新的对应关系文件即进入步骤S1,或者是选择下载原有的对应关系文件。
当用户选择下载原有的对应关系文件,云计算端向本地客户端下发原有的对应关系文件的信息,包括对应关系文件建立时间和用户自定义对应关系文件名称;所述的用户自定义对应关系文件名称为在步骤S4云计算端将标准化的对应关系文件下发至本地客户端后,用户自定义的名称。
一种医疗数据字典自动标准化的系统,包括多个本地客户端和一个云计算端;所述的本地客户端包括:
数据字典上传模块:用于将未知标准符合性的数据字典向云计算端上传;
标准化文件接收模块:用于接收来自云计算端的标准化的对应关系文件;
本地数据标准化模块:通过标准化文件接收模块接收到的标准化的对应关系文件,对本地数据进行标准化;
所述的云计算端包括:
数据字典接收模块:用于接收来自本地客户端上传的未知标准符合性的数据字典;
数据字典自动匹配模块:用于将来自本地客户端上传的未知标准符合性的数据字典与中心标准字典自行进行匹配,并自动建立对应关系;
对应关系文件形成模块:用于根据数据字典匹配模块得到的对应关系结果生成对应关系文件;
对应关系文件下发模块:用于将生成的对应关系文件下发至本地客户端;
中心标准字典存储模块:用于存储标准化数据字典的数据;
中心标准字典对应关系存储模块:用于存储与中心标准字典的对应关系。
所述的数据字典自动匹配模块包括:
文件解析子模块:用于将文件解析至数据源字段;
字段值域校验子模块:用于将数据源字段进行值域校验,判断字段是否标准;
分类子模块:用于将字段值域校验子模块判断出的不标准部分进行分类并归类;
值域匹配子模块:用于判断值域匹配知识库是否能匹配不标准部分的字段;
标准化规则建立子模块:用于对字段语义匹配子模块能匹配的部分自动建立可识别字段值域标准化规则;
字段语义匹配子模块:用于对值域匹配子模块输出的标准字段以及对标准化规则建立子模块输出的可识别字段值域标准化规则进行判断,判断字段语义知识库是否能自动识别语义匹配字段;
通知与选择项下发子模块:用于对值域匹配子模块不能匹配的部分以及对字段语义匹配子模块无法自动匹配的部分,向本地客户端发送通知与选择项;
中心字典标准化映射方法生成子模块:用于对字段语义匹配子模块中可自动匹配的字段生成中心字典标准化映射方法;
整合子模块:用于对中心字典标准化映射方法生成子模块输出的映射方法整合为标准化映射方法包,并发送至对应关系文件形成模块;
所述的中心标准字典存储模块包括:标准字段值域字典,值域匹配知识库和字段语义知识库;
所述的本地客户端还包括:
通知与选择项查看模块:用于查看云计算端下发的通知与选择项;
自行匹配模块:用于将未知标准符合性的数据字典或者是匹配失败数据与云计算端下发的选择项进行自行匹配;
自行匹配上传模块:将自行匹配模块的上传结果上传至数据字典自动匹配模块相应的子模块中,包括字段语义匹配子模块和值域匹配子模块。
本专利技术的有益效果是:
(1)本专利技术采用基于云服务的方式,对各厂商或者医院的非标准数据字典进行标准化操作,具体地:各厂商或者医院的本地客户端将非标准数据字典上传至云计算端,云计算端自动进行匹配,并将标准化的对应关系文件发送至本地客户端,本地客户端就可以在本地进行标准化;方便快捷。
(2)本专利技术的自动匹配过程中包括值域匹配、语义匹配,可靠性高。
(3)本专利技术还在云计算端保存用户的标准化的对应关系文件,当由于设备故障或者误操作等原因造成的标准化的对应关系文件丢失,或者在另外一处也需要此对应关系文件时,不需要再次进行标准化流程,直接获取文件,使用方便并且可靠性高。
(4)同时本专利技术还允许用户保存多种标准化的对应关系文件,方便用户进行选择。
附图说明
图1为本专利技术方法流程图;
图2为本专利技术自行匹配流程图;
本文档来自技高网
...
一种医疗数据字典自动标准化的方法与系统

【技术保护点】
一种医疗数据字典自动标准化的方法,其特征在于:它包括以下步骤:S1:本地客户端向云计算端上传未知标准符合性的数据字典;S2:云计算端将上传的未知标准符合性的数据字典与中心标准字典进行匹配,自动建立两个字典之间的对应关系;S3:云计算端形成标准化的对应关系文件;S4:云计算端将标准化的对应关系文件下发至本地客户端,本地客户端通过标准化的对应关系文件对本地数据进行标准化。

【技术特征摘要】
1.一种医疗数据字典自动标准化的方法,其特征在于:它包括以下步骤:
S1:本地客户端向云计算端上传未知标准符合性的数据字典;
S2:云计算端将上传的未知标准符合性的数据字典与中心标准字典进行匹配,自动建立两个字典之间的对应关系;
S3:云计算端形成标准化的对应关系文件;
S4:云计算端将标准化的对应关系文件下发至本地客户端,本地客户端通过标准化的对应关系文件对本地数据进行标准化。
2.根据权利要求1所述的一种医疗数据字典自动标准化的方法,其特征在于:所述的中心标准字典包括标准字段值域字典,在进行匹配的时候采用值域匹配知识库和字段语义知识库。
3.根据权利要求1或2所述的一种医疗数据字典自动标准化的方法,其特征在于:所述的步骤S2包括以下子步骤:
S201:云计算端解析文件至数据源字段;
S202:调取标准字段值域字典;
S203:将数据源字段进行值域校验,判断字段是否标准:若判断结果发现字段中有不标准部分则进入步骤S204,否则进入步骤S208;
S204:对不标准部分的字段进行分类并归类;
S205:调用值域匹配知识库,判断知识库是否能匹配不标准部分的字段:若判断为能完全匹配则进入步骤S207,否则进入步骤S206;
S206:对无法进行值域匹配知识库匹配的部分,发送至本地客户端,用户通过本地客户端自主进行字段值域修改,并将结果发送回云计算端,返回步骤S203;
S207:自动建立可识别字段值域标准化规则;
S208:调用字段语义知识库,判断是否能自动识别语义匹配字段:如果可以自动匹配字段,进入步骤S209,否则进入步骤S210;
S209:生成中心字典标准化映射方法,进入步骤S211;
S210:对无法自动匹配字段的部分,发送至本地客户端,用户通过本地客户端进自行映射,并将结果发送回云计算端,返回步骤S208;对于可以自动匹配字段的部分,云计算端对中心标准字典进行更新;
S211:整合标准化映射方法包。
4.根据权利要求1所述的一种医疗数据字典自动标准化的方法,其特征在于:还包括一个用户登录步骤S0,包括以下子步骤:
S01:用户通过本地客户端登陆,建立与云计算端的连接关系;
S02:用户选择建立新的对应关系文件即进入步骤S1,或者是选择下载原有的对应关系文件。
5.根据权利要求4所述的一种医疗数据字典自动标准化的方法,其特征在于:当用户选择下载原有的对应关系文件,云计算端向本地客户端下发原有的对应关系文件的信息,包括对应关系文件建立时间和用户自定义对应关系文件名称;所述的用户自定义对应关系文件名称为在步骤S4云计算端将标准化的对应关系文件下发至本地客户端后,用户自定义的名称。
6....

【专利技术属性】
技术研发人员:孟群胡建平曲建明
申请(专利权)人:国家卫生计生委统计信息中心成都金盘电子科大多媒体技术有限公司
类型:发明
国别省市:北京;11

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1