一种专病数据库构建方法及系统技术方案

技术编号:30767133 阅读:87 留言:0更新日期:2021-11-10 12:28
本发明专利技术公开了一种专病数据库构建方法及系统。本发明专利技术包括以下步骤:S1,获取专病病例数据,将所述专病病例数据转化为图像数据;S2,构建数据库,所述数据库包含多个存储表,所述存储表用于存储专病病例数据,多个所述存储表均以病例的唯一标识作为主键;S3,基于卷积神经网络,构建文字识别器;S4,将专病病例数据分类为医学影像数据和文字图像数据两类;S5,把医学影像直接存储到存储表中;S6,处理文字图像数据,并使用文字识别器识别文字图像数据,识别出文字图像中的文字,并将文字存储到存储表中;S7、将文字图像数据上传至云端数据库进行数据分析。具有便于输入数据且减少专病研究工作中干扰的效果。作中干扰的效果。作中干扰的效果。

【技术实现步骤摘要】
一种专病数据库构建方法及系统


[0001]本专利技术涉及一种数据存储方法,特别涉及一种专病数据库构建方法及系统。

技术介绍

[0002]数据库是“按照数据结构来组织、存储和管理数据的仓库”,是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。随着数据库的发展,将数据库应用到一些领域中,能够带来突破性的效果。在当代的医学研究中,一些复杂的病症需要更深入的研究,离不开大量的样本和更加全面的数据,将数据库技术应用到医疗方面能够促进医学研究的发展,提高医疗服务能力。在一些医院和医学研究机构中,已经在针对某些疾病建立专病数据库来支撑专病研究。
[0003]现有专利公开号为CN105956156A的中国专利技术专利公开了一种误诊疾病数据库,包括数据库登录模块、疾病查询模块、疾病分析模块、查询结果显示模块和云端平台;数据库登录模块用于进入误诊疾病数据库;疾病查询模块用于查询误诊疾病的信息;疾病分析模块用于分析所要查询的误诊疾病信息;查询结果显示模块用于显示误诊疾病的查询结果;云端平台用于存放误诊疾病的信息。
[0004]但是在一些疾病研究中,存在海量的数据需要输入到数据库中,但是现存的病例数据大多为纸质保存,造成数据库的维护人员需要花费大量的时间来处理输入数据,工作量巨大;且因为医生的个人书写习惯,有些字迹不易辨认,为研究工作带来极大的干扰。

技术实现思路

[0005]为了便于输入数据,减少专病研究工作中的干扰,本申请提供一种专病数据库构建方法及系统。
[0006]一方面,
[0007]本申请提供的一种专病数据库构建方法采用如下的技术方案:
[0008]一种专病数据库构建方法,包括以下步骤:
[0009]S1,获取专病病例数据,将所述专病病例数据转化为图像数据;
[0010]S2,构建数据库,所述数据库包含多个存储表,所述存储表用于存储专病病例数据,多个所述存储表均以病例的唯一标识作为主键;
[0011]S3,基于卷积神经网络,构建文字识别器;
[0012]S4,将专病病例数据分为医学影像数据和文字图像数据两类;
[0013]S5,把医学影像直接存储到存储表中;
[0014]S6,处理文字图像数据,并使用文字识别器识别文字图像数据,识别出文字图像中的文字,并将文字存储到存储表中。
[0015]通过设置文字识别器,文字识别器能够识别文字图像中所包含的文字,在将数据输入到数据库的过程中,不需要工作人员进行大量的打字劳动,就能够将图像中所包含的文字转换为能够直接存储到数据库中的文字,能够极大的降低工作人员的劳动强度。且将
病人专病病例数据分类为医学影像数据和文字图像数据两类,研究人员在提取专病病例数据时,不需要研究别的医生的书写习惯,能够较为直接的得到所需的数据,减少研究中因医生书写习惯而带来的干扰。
[0016]优选地,在步骤S2中,还包括,S21,设置索引表,所述索引表用于存储病人的唯一标识。
[0017]优选地,所述文字识别器包括输入层、隐藏层和输出层,其中,
[0018]所述输入层,用于输入样本;
[0019]所述隐藏层,包含卷积层、线性整流层、池化层和全连接层;
[0020]所述输出层,用于输出分类结果。
[0021]优选地,在构建文字识别器的过程中,所述线性整流层中设置有激活函数,所述激活函数选用ReLU函数,所述全连接层中设置有损失函数,所述损失函数选用交叉熵函数,且设置有softmax。
[0022]优选地,构建文字识别器还包括,S31,获取文字训练样本和对抗样本,训练文字识别器。
[0023]优选地,所述文字训练样本为完全攻破的数据。
[0024]优选地,所述训练样本还包括对抗样本,所述对抗样本通过攻击算法攻击训练样本得到。
[0025]优选地,在步骤S1中,病例的唯一标识选择病人的就诊号。
[0026]优选的,还包括步骤,S7、将文字图像数据上传至云端数据库进行数据分析。
[0027]另一方面
[0028]提供一种专病数据库系统,包括数据库、采集单元、识别单元和索引单元;
[0029]数据库,包含多个存储表,用于存储数据;
[0030]数据采集单元,用于采集数据,将纸质的病例数据转换为图像类型的病例数据;
[0031]识别单元,用于处理文字图像,识别文字图像中所包含的文字,得到病例数据;
[0032]索引单元,设置在数据库中,用于存储专病病例的唯一标识,形成索引。
[0033]与现有技术相比,本专利技术的有益效果:本专利技术通过设置文字识别器,文字识别器能够识别文字图像中所包含的文字,在将数据输入到数据库的过程中,不需要工作人员进行大量的打字劳动,就能够将图像中所包含的文字转换为能够直接存储到数据库中的文字,能够极大的降低工作人员的劳动强度。且将病人专病病例数据分类为医学影像数据和文字图像数据两类,研究人员在提取专病病例数据时,不需要研究别的医生的书写习惯,能够较为直接的得到所需的数据,减少研究中因医生书写习惯而带来的干扰。
附图说明:
[0034]图1为本专利技术方法流程框图。
具体实施方式
[0035]下面结合试验例及具体实施方式对本专利技术作进一步的详细描述。但不应将此理解为本专利技术上述主题的范围仅限于以下的实施例,凡基于本
技术实现思路
所实现的技术均属于本专利技术的范围。
[0036]实施例1
[0037]如图1所示,一种专病数据库构建方法,包括,
[0038]S1,获取专病病例数据,将专病病例数据转化为图像数据。
[0039]转化的过程需要工作人员处理,医院在长期治疗专病的过程所积攒的专病病例数据中,用药历史、医嘱、诊断结果和通知书之类的数据大多为纸质化,在收录到数据库的过程中,负责收录的工作人员使用扫描仪器或高清相机,将纸质化的专病病例数据转化为图像数据,以便于将专病病例数据输入到数据库中进行存储。从而避免了大量的文字输入工作,能够极大的减少工作人员的工作量。
[0040]S2,构建数据库,数据库包含多个存储表,存储表用于存储专病病例数据,多个存储表均以病例的唯一标识作为主键。
[0041]每个存储表均保存了一个专病病例数据,通过存储表的主键,在使用数据库时,研究人员能够在第一时间定位到需要研究的专病病例。还设置有索引表,索引表用于存储病人的唯一标识。索引表在数据库中的作用相当于字典目录在字典中的作用,通过索引表,研究人员能够更方便的查询到所需的专病病例数据。
[0042]在本实施例中,病人的唯一标识选择就诊号,病人均通过就诊号来就诊,选择病人的就诊号作为病人的唯一标识;能够在一定程度上隐藏病人的信息。且在将病人的数据输入到数据库的过程中,对病人的隐私数据进行脱敏处理;例如,病人的身份证号脱敏处理后就为:xxxxxx198512xxxxxx;在数据库中仅保留研究人员在研究过程中所需的数据,研究人员在研究专本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种专病数据库构建方法,其特征在于:包括以下步骤:S1,获取专病病例数据,将所述专病病例数据转化为图像数据;S2,构建数据库,所述数据库包含多个存储表,所述存储表用于存储专病病例数据,多个所述存储表均以病例的唯一标识作为主键;S3,基于卷积神经网络,构建文字识别器;S4,将专病病例数据分为医学影像数据和文字图像数据两类;S5,把医学影像直接存储到存储表中;S6,处理文字图像数据,并使用文字识别器识别文字图像数据,识别出文字图像中的文字,并将文字存储到存储表中。2.根据权利要求1所述的一种专病数据库构建方法,其特征在于:在步骤S2中,还包括,S21,设置索引表,所述索引表用于存储病人的唯一标识。3.根据权利要求2所述的一种专病数据库构建方法,其特征在于:所述文字识别器包括输入层、隐藏层和输出层,其中,所述输入层,用于输入样本;所述隐藏层,包含卷积层、线性整流层、池化层和全连接层;所述输出层,用于输出分类结果。4.根据权利要求3所述的一种专病数据库构建方法,其特征在于,在构建文字识别器的过程中,所述线性整流层中设置有激活函数,所述激活函数选用ReLU函数,所述全连接层中设...

【专利技术属性】
技术研发人员:殷晋洪磊邱甲军
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1