基于体外诊断的数据分析系统及方法技术方案

技术编号:35780665 阅读:15 留言:0更新日期:2022-12-01 14:25
本发明专利技术公开了一种基于体外诊断的数据分析系统及方法,具体涉及数据分析技术领域,包括数据采集模块、数据第一预处理模块、数据第二预处理模块、第一数据分析模块、第二数据分析模块,以及数据库模块,所述第二数据分析模块用于调用数据库信息并进行数据挖掘,第二数据分析模块包括健康分析单元、预测分析单元,具体采用数据第一预处理模块识别、标记和采集数据,并通过第一数据分析模块中的个人健康分析单元得到用户健康隐患评分,通过第二预处理模块中的数据修正单元减少不同设备间的误差,便于不同设备的数据汇总,通过第二数据分析模块中的健康分析单元建立人群健康画像,得到健康数据的形象表达。康数据的形象表达。康数据的形象表达。

【技术实现步骤摘要】
基于体外诊断的数据分析系统及方法


[0001]本专利技术涉及数据分析
,更具体地说,本专利技术涉及一种基于体外诊断的数据分析系统及方法。

技术介绍

[0002]体外诊断,即IVD(In Vitro Diagnosis),是指在人体之外,通过对人体样本(血液、体液、组织等)进行检测而获取临床诊断信息,进而判断疾病或机体功能的产品和服务。体外诊断产品主要由诊断设备和诊断试剂构成。
[0003]体外诊断行业与检验医学构成了既相互区别又相互紧密联系的有机整体。体外诊断行业是检验医学的工具和兵器,同时检验医学是体外诊断行业的用户和市场,两者的共同目的是实施体外诊断。临床诊断信息的80%左右来自体外诊断,而其费用占医疗费用不到20%。体外诊断已经成为人类疾病预防、诊断、治疗日益重要的组成部分,也是保障人类健康与构建和谐社会日益重要的组成部分。利用大量的数据进行处理和分析以有效地发现隐含在数据中的某些特定的关联关系,推测数据的发展趋势,以从中获得对用户有用的信息,并指导后续的生产生活实践,是非常有益的。
[0004]现有的体外诊断产生的数据以报告形式呈现,无论是纸质报告还是电子报告,呈现形式比较分散,患者在获得若干张报告后,依赖医生讲解分析报告,给患者带来不便,同时医生在为患者讲解分析后,体外诊断数据归于数据库,缺少对数据的充分利用,导致资源的浪费。同时体外诊断数据联网后存在有被恶意攻击以及故障导致数据无法恢复的风险。

技术实现思路

[0005]为了克服现有技术的上述缺陷,本专利技术的实施例提供基于体外诊断的数据分析系统及方法,通过对体外诊断产生数据的分析,产生有益于医院管理的数据,以解决上述
技术介绍
中提出的问题。
[0006]为实现上述目的,本专利技术提供如下技术方案:基于体外诊断的数据分析系统,包括数据采集模块、数据第一预处理模块、数据第二预处理模块、第一数据分析模块、第二数据分析模块,以及数据库模块,所述数据采集模块用于采集体外诊断数据并将采集的数据传输至数据第一预处理模块;所述数据第一预处理模块用于识别和标记采集的数据,标记后进行清洗,去除数据中异常数据,并将数据传输至第一数据分析模块和数据第二预处理模块;所述第一数据分析模块用于分析生成个人健康报告得出个人版健康报告并结合历史诊断数据,形成个人体外诊断数据库的完整数据,根据完整数据生成个人健康变化曲线,将得到的数据传输至个人数据库中更新得到新的数据库;所述数据第二预处理模块用于进一步清洗数据去除数据中个人隐私数据,并减少不同设备产生数据误差,并将处理后的数据汇总至数据库模块;所述数据库模块用于存储体外诊断产生的数据,数据库能被第二数据分析模块调用;所述第二数据分析模块用于调用数据库信息并进行数据挖掘,第二数据分析模块包括健康分析单元、预测分析单元,上述模块间数据传输过程中包括加密单元,所述加
密单元通过身份验证、授权和记账保证数据安全。
[0007]在一个优选地实施方式中,所述第一预处理模块包括数据识别单元、数据清洗单元、数据变换单元,所述数据识别单元用于识别数据时间序列和诊断项目,并将数据按照时间和体外诊断项目进行排列,所述数据清洗单元用于清洗数据,得到没有缺失、重复的数据,所述数据变换单元通过数据规范化处理诊断数据,通过特征二值化得到正常数据集和异常数据集,包括下列步骤:首先根据数据所属项目划分为若干组,然后分别设置每组阈值,所述阈值为人体健康参数范围,最后自动判断数据是否在阈值内,得到正常数据集和异常数据集。
[0008]在一个优选地实施方式中,所述第一数据分析模块包括账号登录单元、历史数据调用单元、个人健康分析单元,所述账号登录单元用于保证用户体外诊断数据的隐私性,通过身份识别、密码登录账号保证个人数据安全性,所述历史数据调用模块根据账户信息自动在数据库中调用历史体外诊断数据,所述个人健康分析单元用于分析数据,先采用时间序列分析异常数据集变化得到每个项目指标随时间变化曲线,再根据指标对健康影响程度设置指标权重,利用权重计算健康隐患或疾病程度,得到健康隐患评分,根据健康隐患评分向用户预警健康变化,向用户发出保持良好习惯和定期体检的提示。
[0009]在一个优选地实施方式中,所述第二预处理模块包括数据修正单元、数据规约单元、数据变换单元,所述数据修正单元用于去除不同设备间存在误差,通过对比试验得到不同诊断设备间数值偏差指数后,根据误差指数对数据进行修正,得到数据,所述数据规约通过维度规约、维度变换、数值规约精简数据,删除数据中不相关的特征,在保留原有判断能力的同时减少特征向量的维度,数据规约中使用主成分分析法,用于消除数据冗余和数据噪声,主成分分析法包括下列步骤:
[0010]步骤S1、对所有的样本进行中心化:
[0011]步骤S2、计算样本的协方差矩阵XXT;
[0012]步骤S3、对矩阵XXT进行特征值分解;
[0013]步骤S4、取出最大的n

个特征值对应的特征向量(w1,wn2),将所有的特征向量标准化后,组成特征向量矩阵W;
[0014]步骤S5、对样本集中的每一个样本x(i),转化为新的样本z(i)=WTx(i),得到输出样本集。
[0015]在一个优选地实施方式中,所述健康分析单元是一种健康画像,通过性别、年龄、区域和体外诊断数据建立人群健康画像,通过分类算法、聚类算法和关联分析得到健康画像的主要特征,包括下列步骤:
[0016]步骤S01、数据导出:从数据库中导出一个时间段的数据;
[0017]步骤S02、提取数据特征建立基本画像,根据决策树分类法得到内部节点和叶子节点,所述内部节点作为主要特征,包括性别、年龄、区域、职业,所述叶子特点表示体外诊断项目;
[0018]步骤S03、计算异常指标发生频率,所述异常数据指超出正常参数范围的数据,在基础画像中标记指标异常发生频率;
[0019]步骤S04、建立异常指标和疾病的关联,将疾病信息导入基本画像得到人群健康画
像。
[0020]为实现上述目的,本专利技术提供如下技术方案:基于体外诊断的数据分析系统的方法,所述方法包括下列步骤:
[0021]步骤S101、数据采集模块采集得到体外诊断数据,所述数据为时序数据,数据采集依赖于通信技术,实行自动数据传输,得到体外诊断初始数据库,将得到的数据传输至第一数据分析模块;
[0022]步骤S102、数据第一预处理模块识别、标记和变换采集的数据,识别和标记基于个人身份唯一识别数据,包括指纹、身份证号码、姓名等隐私数据,标记后通过数据清洗提高数据质量,然后进行数据变换,通过特征二值化得到正常数据集和异常数据集,最后将标记、清洗、变换后的高质量数据传输至第一数据分析模块和数据第二预处理模块;
[0023]步骤S103、第一数据分析模块分析接收的数据,首先用户通过身份识别、密码登录账号,在账号中查看个人诊断数据,并结合历史诊断数据,形成个人体外诊断数据库的完整数据,采用时间序列分析异常数据集变化得到每个项目指标随本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于体外诊断的数据分析系统,其特征在于:包括数据采集模块、数据第一预处理模块、数据第二预处理模块、第一数据分析模块、第二数据分析模块,以及数据库模块,所述数据采集模块用于采集体外诊断数据并将采集的数据传输至数据第一预处理模块;所述数据第一预处理模块用于识别和标记采集的数据,标记后进行清洗,去除数据中异常数据,并将数据传输至第一数据分析模块和数据第二预处理模块;所述第一数据分析模块用于分析生成个人健康报告得出个人版健康报告并结合历史诊断数据,形成个人体外诊断数据库的完整数据,根据完整数据生成个人健康变化曲线,将得到的数据传输至个人数据库中更新得到新的数据库;所述数据第二预处理模块用于进一步清洗数据去除数据中个人隐私数据,并减少不同设备产生数据误差,并将处理后的数据汇总至数据库模块;所述数据库模块用于存储体外诊断产生的数据,数据库能被第二数据分析模块调用;所述第二数据分析模块用于调用数据库信息并进行数据挖掘,第二数据分析模块包括健康分析单元、预测分析单元,上述模块间数据传输过程中包括加密单元,所述加密单元通过身份验证、授权和记账保证数据安全。2.根据权利要求1所述的基于体外诊断的数据分析系统,其特征在于:所述第一预处理模块包括数据识别单元、数据清洗单元、数据变换单元,所述数据识别单元用于识别数据时间序列和诊断项目,并将数据按照时间和体外诊断项目进行排列,所述数据清洗单元用于清洗数据,得到没有缺失、重复的数据,所述数据变换单元通过数据规范化处理诊断数据,通过特征二值化得到正常数据集和异常数据集,包括下列步骤:首先根据数据所属项目划分为若干组,然后分别设置每组阈值,所述阈值为人体健康参数范围,最后自动判断数据是否在阈值内,得到正常数据集和异常数据集。3.根据权利要求1所述的基于体外诊断的数据分析系统,其特征在于:所述第一数据分析模块包括账号登录单元、历史数据调用单元、个人健康分析单元,所述账号登录单元用于保证用户体外诊断数据的隐私性,通过身份识别、密码登录账号保证个人数据安全性,所述历史数据调用模块根据账户信息自动在数据库中调用历史体外诊断数据,所述个人健康分析单元用于分析数据,先采用时间序列分析异常数据集变化得到每个项目指标随时间变化曲线,再根据指标对健康影响程度设置指标权重,利用权重计算健康隐患或疾病程度,得到健康隐患评分,根据健康隐患评分向用户预警健康变化,向用户发出保持良好习惯和定期体检的提示。4.根据权利要求1所述的基于体外诊断的数据分析系统,其特征在于:所述第二预处理模块包括数据修正单元、数据规约单元,所述数据修正单元用于去除不同设备间存在误差,通过对比试验得到不同诊断设备间数值偏差指数后,根据误差指数对数据进行修正,所述数据规约通过维度规约、维度变换、数值规约精简数据,删除数据中不相关的特征,在保留原有判断能力的同时减少特征向量的维度,数据规约中使用主成分分析法,用于消除数据冗余和数据噪声。5.根据权利要求4所述的基于体外诊断的数据分析系统,其特征在于:所述主成分分析法包括下列步骤:步骤S1、对所有的样本进行中心化,中...

【专利技术属性】
技术研发人员:高俊莉高俊顺王炜欣关虹
申请(专利权)人:杭州广科安德生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1