临床检测项目的数据处理方法、装置及电子设备制造方法及图纸

技术编号:17409782 阅读:19 留言:0更新日期:2018-03-07 06:42
本发明专利技术提供了一种临床检测项目的数据处理方法、装置及电子设备,涉及医疗技术领域,以缓解现有技术中存在的风险预测准确度不高的问题,并提出了一套全面的技术和理念去发现疾病、临床测试和基因的关系。该数据处理方法包括:获取临床检测项目的原始数据;基于支持向量回归的预测模型,补充原始数据中的缺失数据,获得临床检测项目的转换数据;基于转换数据,根据不同临床检测项目之间的关联性,生成临床检测项目的关联性数据。能够解决EHR数据中存在的缺失的数据、不均衡分布和不确定数据注释三个问题,以临床检测项目间的关联网络实现疾病风险预测,改善了疾病风险预测的准确度。

Data processing methods, devices and electronic equipment for clinical testing projects

The invention provides a processing method, the clinical data detection device and electronic equipment, and relates to the technical field of medical care, to alleviate the problem of low accuracy of the existing risk forecast technology, and puts forward a set of comprehensive technology and ideas to find the relationship between disease, clinical testing and gene. The data processing method includes obtaining the original data of clinical detection project; prediction model based on support vector regression, the missing data of the original data, conversion of clinical detection project data; based on data conversion, according to the correlation between different clinical tests, generating data correlation of clinical detection project. It can solve the three problems of missing data, unbalanced distribution and uncertain data annotation in EHR data, and achieve the prediction of disease risk through the correlation network between clinical detection items, and improve the accuracy of disease risk prediction.

【技术实现步骤摘要】
临床检测项目的数据处理方法、装置及电子设备
本专利技术涉及生物医疗
,尤其是涉及一种临床检测项目的数据处理方法、装置及电子设备。
技术介绍
随着生物医学信息学和计算机系统的快速发展,电子健康记录(EHR)得以广泛的使用。此外,国家的医疗保健计划,越来越多的人参与到定期的体检和其他的医疗活动当中,使得EHR为生物医学研究和医疗保健服务提供了大数据资源。自定义的统计数据挖掘和机器学习技术已经被应用于EHR中,并且用于解决在生物医学和医疗保健大数据方面遇到的困难。然而,在EHR大数据领域内,存在三个需要引起重视的问题,第一、EHR数据包含由于人为错误导致的缺失值的问题;第二、EHR数据缺乏深入和统一的标注,即对于相同的结果,不同的患者可能得到不同的注释的问题;第三、EHR数据存在小部分的、自然发生的导致分析结果出现偏差的异常事件(数据不均衡分布)的问题。目前,尽管许多先进的数据分析技术和系统已被开发来管理电子病历数据,但是,每个技术或系统往往只能够应用于一个方面或者几个简单的方面,例如OpenMRS和dhis2技术只能应用在数据库、数据集成和简单的统计报告方面。然而在EHR数据应用中,针对大量的高危疾病问题还没有一种技术或者系统来解决上述提到的大容量电子病历数据存在的三个需要引起重视的问题。综上所述,现有的数据分析技术和系统在EHR数据应用中,存在疾病风险预测准确度不高的问题。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种临床检测项目的数据处理方法、装置及电子设备,以缓解现有技术中存在的风险预测准确度不高的技术问题。第一方面,本专利技术实施例提供了一种临床检测项目的数据处理方法,包括:获取临床检测项目的原始数据;基于支持向量回归的预测模型,补充所述原始数据中的缺失数据,获得临床检测项目的转换数据;基于所述转换数据,根据不同临床检测项目之间的关联性,生成临床检测项目的关联性数据。结合第一方面,本专利技术实施例提供了第一方面的第一种可能的实施方式,其中,该方法还包括:基于所述转换数据,根据临床检测项目与基因之间的关联性,生成临床检测项目与基因的关联性数据。结合第一方面,本专利技术实施例提供了第一方面的第二种可能的实施方式,其中,该方法还包括:基于所述转换数据,根据临床实验结果的分布和聚类算法,生成疾病高危人群数据。结合第一方面,本专利技术实施例提供了第一方面的第三种可能的实施方式,其中,该方法还包括:基于所述转换数据,根据临床检测项目与疾病之间的关联性,对预测目标进行疾病风险预测。结合第一方面,本专利技术实施例提供了第一方面的第四种可能的实施方式,其中,该方法还包括:根据所述临床检测项目的关联性数据,获取临床检测项目与生物标志物的关联性,生成生物标志物与疾病的关联性数据。第二方面,本专利技术实施例还提供一种临床检测项目的数据处理装置,包括:获取模块,用于获取临床检测项目的原始数据;转换模块,用于基于支持向量回归的预测模型,补充所述原始数据中的缺失数据,获得临床检测项目的转换数据;关联模块,用于基于所述转换数据,根据不同临床检测项目之间的关联性,生成临床检测项目的关联性数据。结合第二方面,本专利技术实施例提供了第二方面的第一种可能的实施方式,其中,所述关联模块还用于基于所述转换数据,根据临床检测项目与基因之间的关联性,生成临床检测项目与基因的关联性数据。结合第二方面,本专利技术实施例提供了第二方面的第二种可能的实施方式,其中,所述关联模块还用于:基于所述转换数据,根据临床实验结果的分布和聚类算法,生成疾病高危人群数据;和/或,基于所述转换数据,根据临床检测项目与疾病之间的关联性,对预测目标进行疾病风险预测。结合第二方面,本专利技术实施例提供了第二方面的第三种可能的实施方式,其中,所述关联模块还用于根据所述临床检测项目的关联性数据,获取临床检测项目与生物标志物的关联性,生成生物标志物与疾病的关联性数据。第三方面,本专利技术实施例还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面及其可能的实施方式中任一项所述的方法的步骤。本专利技术实施例带来了以下有益效果:本专利技术实施例提供了一种临床检测项目的数据处理方法、装置及电子设备,其中,该数据处理方法包括:获取临床检测项目的原始数据;基于支持向量回归的预测模型,补充原始数据中的缺失数据,获得临床检测项目的转换数据;基于转换数据,根据不同临床检测项目之间的关联性,生成临床检测项目的关联性数据。因此,本专利技术实施例提供的技术方案中,通过基于支持向量回归的预测模型,将原始数据中的缺失数据进行转化后补充,得到转换数据,能够解决EHR数据中存在的缺失的数据、不均衡分布和不确定数据注释三个问题,同时对转换数据进行挖掘分析,获取了不同临床检测项目的关联性数据,以临床检测项目间的关联网络实现疾病风险预测,改善了疾病风险预测的准确度。这里需要指出的是,基于向量回归的预测模型的优势在于:由于借助了支持向量线性回归法,从而能够得到两种(或者多种)临床检测项目的因果关系;而现有技术中仅能得到两种临床检测项目的共现关系。众所周知,因果关系相比于共现关系具有更加丰富的信息。本专利技术的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例一提供的一种临床检测项目的数据处理方法的流程图;图2为本专利技术实施例提供的基于支持向量回归的预测模型构建clinotype-clinotype关系网络的流程图;图3为本专利技术实施例二提供的一种临床检测项目的数据处理方法的流程图;图4为本专利技术实施例提供的基于规则的分类算法来预测糖尿病的过程;图5为本专利技术实施例提供的肺癌临床生物标志物的发现过程。图6为本专利技术实施例三提供的一种临床检测项目的数据处理装置的结构框图;图7为本专利技术实施例提供的一种电子设备的结构示意图;图8为本专利技术实施例三提供的用于验证的clinotype-clinotype关联网络结构图;图9为本专利技术实施例三提供的通过共同基因评分的clinotype-clinotype关系网络验证图;图10为本专利技术实施例三提供的基于方差分析的5个特定clinotype队列图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。目前现有的数据分析技术和系统在EHR数据应用中,存在疾病风险预测准确度不高的问题,基于此,本专利技术实施例提供的一种临本文档来自技高网...
临床检测项目的数据处理方法、装置及电子设备

【技术保护点】
一种临床检测项目的数据处理方法,其特征在于,包括:获取临床检测项目的原始数据;基于支持向量回归的预测模型,补充所述原始数据中的缺失数据,获得临床检测项目的转换数据;基于所述转换数据,根据不同临床检测项目之间的关联性,生成临床检测项目的关联性数据。

【技术特征摘要】
1.一种临床检测项目的数据处理方法,其特征在于,包括:获取临床检测项目的原始数据;基于支持向量回归的预测模型,补充所述原始数据中的缺失数据,获得临床检测项目的转换数据;基于所述转换数据,根据不同临床检测项目之间的关联性,生成临床检测项目的关联性数据。2.根据权利要求1所述的方法,其特征在于,还包括:基于所述转换数据,根据临床检测项目与基因之间的关联性,生成临床检测项目与基因的关联性数据。3.根据权利要求1所述的方法,其特征在于,还包括:基于所述转换数据,根据临床实验结果的分布和聚类算法,生成疾病高危人群数据。4.根据权利要求1所述的方法,其特征在于,还包括:基于所述转换数据,根据临床检测项目与疾病之间的关联性,对预测目标进行疾病风险预测。5.根据权利要求1所述的方法,其特征在于,还包括:根据所述临床检测项目的关联性数据,获取临床检测项目与生物标志物的关联性,生成生物标志物与疾病的关联性数据。6.一种临床检测项目的数据处理装置,其特征在于,包括:获取模块,用于获取临床检测项目的原始数据;转换模块,...

【专利技术属性】
技术研发人员:陈越阮明成
申请(专利权)人:温州悦康信息技术有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1