当前位置: 首页 > 专利查询>金敏专利>正文

医疗数据整理方法、医疗数据整理装置和电子设备制造方法及图纸

技术编号:24409817 阅读:64 留言:0更新日期:2020-06-06 08:41
本申请涉及一种医疗数据整理方法、医疗数据整理装置和电子设备。该医疗数据整理方法,包括:获取与客户相关的原始医疗数据;以及,对原始医疗数据进行处理,以获得医疗数据库,其中,所述医疗数据库的数据结构中包括原始信息数据库、客户体检信息库、病例样本库、模型指标库、预测结果库和用户访问授权库。这样,将临床医疗大数据进行关联分析和数据管理,以利于医疗大数据分析,例如,用于癌症等其他慢性疾病的预测等。

Medical data processing methods, medical data processing devices and electronic equipment

【技术实现步骤摘要】
医疗数据整理方法、医疗数据整理装置和电子设备
本专利技术总体地涉及数据处理领域,特别是涉及医疗数据整理方法、医疗数据整理装置和电子设备。
技术介绍
癌症是中国人口的主要死亡因素之一。有数据显示:癌症如果发现的早,治愈率非常高。在美国,乳腺癌1期和2期的5年生存率高达89%,综合所有癌症类型和分期,2015年癌症总治愈率也有70%,这里面最主要的原因是病灶发现的早。通过临床医疗数据大数据对癌症进行预测是当下的一个热点话题。然而,医疗临床数据(包括体检数据和诊断数据等)就像一块掩埋在深山中的宝藏。虽然山中有金矿,但是如果没有良好的开采技术与开采设备,大片金矿也只能是草木不生的戈壁。临床医疗大数据无论是对于药企、医疗服务提供者还是医疗支付方以及患者都有巨大的作用。但是,目前由于数据密度低,数据处于孤岛状态,缺少关联分析,并且大量数据没有与病人长期随访相连接,所以医疗临床数据的价值并没有被充分开发和利用起来。因此,需要一种医疗数据整理技术方案将临床医疗大数据进行关联分析,以充分挖掘医疗大数据的潜在价值。
技术实现思路
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种医疗数据整理方法、医疗数据整理装置和电子设备,其通过对获取的与客户相关的医疗数据进行处理,以形成具有特定数据结构的医疗数据库,其中所述医疗数据库包括原始信息数据库、客户体检信息库、病例样本库、模型指标库、预测结果库和用户访问授权库。通过这样的方式,将临床医疗大数据进行关联分析和数据管理,以利于医疗大数据分析,例如,用于癌症等其他慢性疾病的预测等。根据本申请的一方面,提供了一种医疗数据整理方法,包括:获取与客户相关的原始医疗数据;以及对原始医疗数据进行处理,以获得医疗数据库,其中,所述医疗数据库的数据结构中包括原始信息数据库、客户体检信息库、病例样本库、模型指标库、预测结果库和用户访问授权库;其中,所述原始信息库包括客户基本信息表、血常规和血生化体检信息表、尿常规体检信息表、肿瘤标记物体检信息表、血流变体检信息表、医院体检中心基本信息表、疾病分类对照表、职业分类对照表和国家简称和全称分类对照表中至少之一或几种的组合;其中,所述客户体检信息库包括客户基本信息表、血常规和血生化体检信息表、尿常规体检信息表、肿瘤标记物体检信息表、血流变体检信息表、医院体检中心基本信息表、疾病分类对照表、职业分类对照表和国家简称和全称分类对照表中至少之一或几种的组合;其中,所述病例样本库包括模型训练表;其中,所述模型指标库包括模型表;其中,所述预测结果库包括评估结果表;以及,其中,所述用户访问授权库包括用户访问授权控制表。在上述医疗数据整理方法中,所述客户基本信息表所包括的数据项选自由客户姓名、性别、出生日期、种族、身份证号、护照、港澳回乡证、台胞证、医院体检号或病案号、电话、电子邮件、通讯地址、职业、既往病史、直系亲属既往病史、常住地、精神压力、吸烟习惯、医院电话和录入系统时间所组成的群组中的一种或几种的组合;所述血常规和血生化体检信息表所包括的数据项选自由客户姓名、性别、年龄、身份证号、护照、港澳回乡证、台胞证、医院体检号或病案号、身高、体重、收缩压、舒张压、体检时间、红细胞、红细胞比积、中性粒细胞%、中性粒细胞数、单核细胞%、单核细胞数、嗜碱性粒细胞%、嗜碱性粒细胞数、嗜酸性粒细胞%、嗜酸性粒细胞数、平均血红蛋白量、平均血红蛋白量浓度、血小板平均体积、白细胞、红细胞平均体积、血小板、血小板体积分布宽度、淋巴细胞%、淋巴细胞数、RBC分别宽度-cv、RBC分别宽度-sd、血小板比积、血红蛋白、白蛋白、谷丙转氨酶、谷草转氨酶、γ-谷氨酰转肽酶、肌酐、尿素、尿酸、空腹血糖、总胆固醇、甘油三脂、高密度脂蛋白、低密度脂蛋白、载脂蛋白a、载脂蛋白b、总胆红素、超敏C反应蛋白、乳酸脱氢酶、总胆汁酸、胆碱酯酶、碱性磷酸酶、α-L-岩藻糖苷酶、β2-微球蛋白(β2-MG)、总蛋白、人工干预情况、医院电话号码、科室来源、创建时间、标志位和疾病名称所组成的群组中的一种或几种的组合;所述尿常规体检信息表所包括的数据项选自由身份证号、护照、港澳回乡证、台胞证、医院体检号或病案号、体检时间、潜血、尿胆素、尿糖、酮体、尿蛋白、尿胆原、亚硝酸盐、白细胞、维生素、比重、酸碱值、医院电话号码、创建时间、标志位和疾病名称所组成的群组中的一种或几种的组合;所述肿瘤标记物体检信息表所包括的数据项选自由身份证号、护照、港澳回乡证、台胞证、医院体检号或病案号、体检时间、甲胎蛋白、糖类抗原125(CA125)、糖类抗原15-3(CA15-3)、糖类抗原19-9(CA19-9)、糖类抗原72-4(CA72-4)、癌胚抗原(CEA)、细胞角蛋白19(CYFRA21-1)、铁蛋白(FER)、神经元特异烯醇化酶(NSE)、前列腺特异性抗原(PSA)、医院电话号码、创建时间、标志位和疾病名称所组成的群组中的一种或几种的组合;所述血流变体检信息表所包括的数据项选自由身份证号、护照、港澳回乡证、台胞证、医院体检号或病案号、体检时间、血粘度、还原粘度、相对粘度、血浆粘度、红细胞沉降率ESR、血沉方程k值、医院电话号码、创建时间、标志位和疾病名称所组成的群组中的一种或几种的组合;所述模型训练表所包括的数据项选自由客户姓名、性别、出生日期、年龄、身份证号、护照、港澳回乡证、台胞证、医院体检号或病案号、身高、体重、收缩压、舒张压、体检时间、红细胞、红细胞比积、中性粒细胞%、中性粒细胞数、单核细胞%、单核细胞数、嗜碱性粒细胞%、嗜碱性粒细胞数、嗜酸性粒细胞%、嗜酸性粒细胞数、平均血红蛋白量、平均血红蛋白量浓度、血小板平均体积、白细胞、红细胞平均体积、血小板、血小板体积分布宽度、淋巴细胞%、淋巴细胞数、RBC分别宽度-cv、RBC分别宽度-sd、血小板比积、血红蛋白、白蛋白、谷丙转氨酶、谷草转氨酶、γ-谷氨酰转肽酶、肌酐、尿素、尿酸、空腹血糖、总胆固醇、甘油三脂、高密度脂蛋白、低密度脂蛋白、载脂蛋白a、载脂蛋白b、总胆红素、超敏C反应蛋白、乳酸脱氢酶、总胆汁酸、胆碱酯酶、碱性磷酸酶、α-L-岩藻糖苷酶、β2-微球蛋白(β2-MG)、总蛋白、潜血、尿胆素、尿糖、酮体、尿蛋白、尿胆原、亚硝酸盐、白细胞、维生素、比重、酸碱值、甲胎蛋白、糖类抗原125(CA125)、糖类抗原15-3(CA15-3)、糖类抗原19-9(CA19-9)、糖类抗原72-4(CA72-4)、癌胚抗原(CEA)、细胞角蛋白19(CYFRA21-1)、铁蛋白(FER)、神经元特异烯醇化酶(NSE)、前列腺特异性抗原(PSA)、血粘度、还原粘度、相对粘度、血浆粘度、红细胞沉降率ESR、血沉方程k值、人工干预情况、医院电话号码、科室来源、创建时间和疾病名称所组成的群组中的一种或几种的组合;所述医院体检中心基本信息表所包括的数据项选自由序号、医院名称、医院电话、医院地址、联系人和联系人电话所组成的群组中的一种或几种的组合;所述疾病分类对照表所包括的数据项选自由序号、疾病名称和疾病代码所组成的群组中的本文档来自技高网...

【技术保护点】
1.一种医疗数据整理方法,其特征在于,包括:/n获取与客户相关的原始医疗数据;以及/n对原始医疗数据进行处理,以获得医疗数据库,其中,所述医疗数据库的数据结构中包括原始信息数据库、客户体检信息库、病例样本库、模型指标库、预测结果库和用户访问授权库;/n其中,所述原始信息库包括客户基本信息表、血常规和血生化体检信息表、尿常规体检信息表、肿瘤标记物体检信息表、血流变体检信息表、医院体检中心基本信息表、疾病分类对照表、职业分类对照表和国家简称和全称分类对照表中至少之一或几种的组合;/n其中,所述客户体检信息库包括客户基本信息表、血常规和血生化体检信息表、尿常规体检信息表、肿瘤标记物体检信息表、血流变体检信息表、医院体检中心基本信息表、疾病分类对照表、职业分类对照表和国家简称和全称分类对照表中至少之一或几种的组合;/n其中,所述病例样本库包括模型训练表;/n其中,所述模型指标库包括模型表;/n其中,所述预测结果库包括评估结果表;以及/n其中,所述用户访问授权库包括用户访问授权控制表。/n

【技术特征摘要】
1.一种医疗数据整理方法,其特征在于,包括:
获取与客户相关的原始医疗数据;以及
对原始医疗数据进行处理,以获得医疗数据库,其中,所述医疗数据库的数据结构中包括原始信息数据库、客户体检信息库、病例样本库、模型指标库、预测结果库和用户访问授权库;
其中,所述原始信息库包括客户基本信息表、血常规和血生化体检信息表、尿常规体检信息表、肿瘤标记物体检信息表、血流变体检信息表、医院体检中心基本信息表、疾病分类对照表、职业分类对照表和国家简称和全称分类对照表中至少之一或几种的组合;
其中,所述客户体检信息库包括客户基本信息表、血常规和血生化体检信息表、尿常规体检信息表、肿瘤标记物体检信息表、血流变体检信息表、医院体检中心基本信息表、疾病分类对照表、职业分类对照表和国家简称和全称分类对照表中至少之一或几种的组合;
其中,所述病例样本库包括模型训练表;
其中,所述模型指标库包括模型表;
其中,所述预测结果库包括评估结果表;以及
其中,所述用户访问授权库包括用户访问授权控制表。


2.如权利要求1所述的医疗数据整理方法,其特征在于,
所述客户基本信息表所包括的数据项选自由客户姓名、性别、出生日期、种族、身份证号、护照、港澳回乡证、台胞证、医院体检号或病案号、电话、电子邮件、通讯地址、职业、既往病史、直系亲属既往病史、常住地、精神压力、吸烟习惯、医院电话和录入系统时间所组成的群组中的一种或几种的组合;
所述血常规和血生化体检信息表所包括的数据项选自由客户姓名、性别、年龄、身份证号、护照、港澳回乡证、台胞证、医院体检号或病案号、身高、体重、收缩压、舒张压、体检时间、红细胞、红细胞比积、中性粒细胞%、中性粒细胞数、单核细胞%、单核细胞数、嗜碱性粒细胞%、嗜碱性粒细胞数、嗜酸性粒细胞%、嗜酸性粒细胞数、平均血红蛋白量、平均血红蛋白量浓度、血小板平均体积、白细胞、红细胞平均体积、血小板、血小板体积分布宽度、淋巴细胞%、淋巴细胞数、RBC分别宽度-cv、RBC分别宽度-sd、血小板比积、血红蛋白、白蛋白、谷丙转氨酶、谷草转氨酶、γ-谷氨酰转肽酶、肌酐、尿素、尿酸、空腹血糖、总胆固醇、甘油三脂、高密度脂蛋白、低密度脂蛋白、载脂蛋白a、载脂蛋白b、总胆红素、超敏C反应蛋白、乳酸脱氢酶、总胆汁酸、胆碱酯酶、碱性磷酸酶、α-L-岩藻糖苷酶、β2-微球蛋白(β2-MG)、总蛋白、人工干预情况、医院电话号码、科室来源、创建时间、标志位和疾病名称所组成的群组中的一种或几种的组合;
所述尿常规体检信息表所包括的数据项选自由身份证号、护照、港澳回乡证、台胞证、医院体检号或病案号、体检时间、潜血、尿胆素、尿糖、酮体、尿蛋白、尿胆原、亚硝酸盐、白细胞、维生素、比重、酸碱值、医院电话号码、创建时间、标志位和疾病名称所组成的群组中的一种或几种的组合;
所述肿瘤标记物体检信息表所包括的数据项选自由身份证号、护照、港澳回乡证、台胞证、医院体检号或病案号、体检时间、甲胎蛋白、糖类抗原125(CA125)、糖类抗原15-3(CA15-3)、糖类抗原19-9(CA19-9)、糖类抗原72-4(CA72-4)、癌胚抗原(CEA)、细胞角蛋白19(CYFRA21-1)、铁蛋白(FER)、神经元特异烯醇化酶(NSE)、前列腺特异性抗原(PSA)、医院电话号码、创建时间、标志位和疾病名称所组成的群组中的一种或几种的组合;
所述血流变体检信息表所包括的数据项选自由身份证号、护照、港澳回乡证、台胞证、医院体检号或病案号、体检时间、血粘度、还原粘度、相对粘度、血浆粘度、红细胞沉降率ESR、血沉方程k值、医院电话号码、创建时间、标志位和疾病名称所组成的群组中的一种或几种的组合;
所述模型训练表所包括的数据项选自由客户姓名、性别、出生日期、年龄、身份证号、护照、港澳回乡证、台胞证、医院体检号或病案号、身高、体重、收缩压、舒张压、体检时间、红细胞、红细胞比积、中性粒细胞%、中性粒细胞数、单核细胞%、单核细胞数、嗜碱性粒细胞%、嗜碱性粒细胞数、嗜酸性粒细胞%、嗜酸性粒细胞数、平均血红蛋白量、平均血红蛋白量浓度、血小板平均体积、白细胞、红细胞平均体积、血小板、血小板体积分布宽度、淋巴细胞%、淋巴细胞数、RBC分别宽度-cv、RBC分别宽度-sd、血小板比积、血红蛋白、白蛋白、谷丙转氨酶、谷草转氨酶、γ-谷氨酰转肽酶、肌酐、尿素、尿酸、空腹血糖、总胆固醇、甘油三脂、高密度脂蛋白、低密度脂蛋白、载脂蛋白a、载脂蛋白b、总胆红素、超敏C反应蛋白、乳酸脱氢酶、总胆汁酸、胆碱酯酶、碱性磷酸酶、α-L-岩藻糖苷酶、β2-微球蛋白(β2-MG)、总蛋白、潜血、尿胆素、尿糖、酮体、尿蛋白、尿胆原、亚硝酸盐、白细胞、维生素、比重、酸碱值、甲胎蛋白、糖类抗原125(CA125)、糖类抗原15-3(CA15-3)、糖类抗原19-9(CA19-9)、糖类抗原72-4(CA72-4)、癌胚抗原(CEA)、细胞角蛋白19(CYFRA21-1)、铁蛋白(FER)、神经元特异烯醇化酶(NSE)、前列腺特异性抗原(PSA)、血粘度、还原粘度、相对粘度、血浆粘度、红细胞沉降率ESR、血沉方程k值、人工干预情况、医院电话号码、科室来源、创建时间和疾病名称所组成的群组中的一种或几种的组合;
所述医院体检中心基本信息表所包括的数据项选自由序号、医院名称、医院电话、医院地址、联系人和联系人电话所组成的群组中的一种或几种的组合;
所述疾病分类对照表所包括的数据项选自由序号、疾病名称和疾病代码所组成的群组中的一种或几种的组合;
所述国家简称和全称分类对照表包括国家名称和国家简称;
所述职业分类对照表包括职业名称和职业代码;
所述模型表所包括的数据项选自由序号、客户姓名、性别、出生日期、年龄、身份证号、护照、港澳回乡证、台胞证、医院体检号或病案号、身高、体重、收缩压、舒张压、红细胞、红细胞比积、中性粒细胞%、中性粒细胞数、单核细胞%、单核细胞数、嗜碱性粒细胞%、嗜碱性粒细胞数、嗜酸性粒细胞%、嗜酸性粒细胞数、平均血红蛋白量、平均血红蛋白量浓度、血小板平均体积、白细胞、红细胞平均体积、血小板、血小板体积分布宽度、淋巴细胞%、淋巴细胞数、RBC分别宽度-cv、RBC分别宽度-sd、血小板比积、血红蛋白、白蛋白、谷丙转氨酶、谷草转氨酶、γ-谷氨酰转肽酶、肌酐、尿素、尿酸、空腹血糖、总胆固醇、甘油三脂、高密度脂蛋白、低密度脂蛋白、载脂蛋白a、载脂蛋白b、总胆红素、超敏C反应蛋白、乳酸脱氢酶、总胆汁酸、胆碱酯酶、碱性磷酸酶、α-L-岩藻糖苷酶、β2-微球蛋白(β2-MG)、总蛋白、潜血、尿胆素、尿糖、酮体、尿蛋白、尿胆原、亚硝酸盐、白细胞、维生素、比重、酸碱值、甲胎蛋白、糖类抗原125(CA125)、糖类抗原15-3(CA15-3)、糖类抗原19-9(CA19-9)、糖类抗原72-4(CA72-4)、癌胚抗原(CEA)、细胞角蛋白19(CYFRA21-1)、铁蛋白(FER)、神经元特异烯醇化酶(NSE)、前列腺特异性抗原(PSA)、血粘度、还原粘度、相对粘度、血浆粘度、红细胞沉降率ESR、血沉方程k值、人工干预情况、医院电话号码、创建时间和疾病名称所组成的群组中的一种或几种的组合;
所述评估结果表所包括的数据项选自由客户姓名、性别、年龄、身份证号、护照、港澳回乡证、台胞证、医院体检号或病案号、医院电话号码、评估结果、评估使用的模型版本和评估时间所组成的群组中的一种或几种的组合;以及
所述用户访问授权控制表所包括的数据项选自由用户名、用户密码、角色、用户注册时间和最后修改时间所组成的群组中的一种或几种的组合。


3.如权利要求1或2所述的医疗数据整理方法,其特征在于,
所述医院体检中心基本信息表通过医院电话作为外键与所述客户基本信息表相关联;
所述职业分类对照表通过职业名称作为外键与所述客户基本信息表相关联;
所述模型表通过疾病名称作为外键与所述疾病分类对照表相关联;
所述评估结果表通过医院体检号或病案号以及医院电话作为外键与所述客户基本信息表相关联;
所述血流变体检信息表通过疾病名称作为外键与所述客户基本信息表相关联;
所述尿常规体检信息表通过疾病名称作为外键与所述疾病分类对照表相关联,且所述尿常规体检信息表通过医院体检号或病案号以及医院电话作为外键与所述客户基本信息表相关联;
所述血常规和血生化体检信息表通过疾病名称作为外键与所述疾病分类对照表相关联,且所述血常规和血生化体检信息表通过医院体检号或病案号以及医院电话作为外键与所述客户基本信息表相关联;
所述模型训练表通过医院体检号或病案号以及医院电话作为外键与所述客户基本信息表相关联;
所述肿瘤标记物体检信息表通过医院体检号或病案号以及医院电话作为外键与所述客户基本信息表相关联;以及
所述国家简称和全称分类对照表通过国家名称与所述客户基本信息表相关联。


4.如权利要求3所述的医疗数据整理方法,其中,所述疾病名称数据项采用3个字符进行编码。


5.如权利要求3所述的医疗数据整理方法,其中,所述既往病史数据项采用可变长多个3字符进行组合编码。


6.如权利要求5所述的医疗数据整理方法,其中,所述医疗数据库的主键或外键被设置为医院号码,以及,医院体检号或病案号。


7.一种医疗数据整理装置,其特征在于,包括:
数据获取单元,用于获取与客户相关的原始医疗数据;以及
数据整理单元,用于对原始医疗数据进行处理,以获得医疗数据库,其中,所述医疗数据库的数据结构中包括原始信息数据库、客...

【专利技术属性】
技术研发人员:郭晓方金敏刘颖丰姜东平
申请(专利权)人:金敏
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1