一种医疗数据采集分析系统技术方案

技术编号:15095282 阅读:163 留言:0更新日期:2017-04-07 22:40
本发明专利技术涉及一种医疗数据采集分析方法,包括以下步骤:1、将原始数据上传至数据平台;2、采用基于条件随机域和依存语法相结合的语义标注算法将原始数据转换为RDF格式的数据;3、通过数据挖掘算法将上一步处理后的数据中同一个病人的RDF数据关联起来并存储到基于分布式文件系统的Hbase数据库中;4、利用统计方法和机器学习方法对Hbase数据库中的数据进行分析,得出分析结论;5、对分析结论进行整理和分类,构建治疗方案知识库。本发明专利技术有针对性的采集人员的整个临床诊疗数据,通过对大量数据进行分析,做出临床辅助诊断、疾病预警和分析患者的行为,在临床上可以帮助医生制定更加有效的、精确的、个性化的治疗方案。

Medical data acquisition analysis method and system

The invention relates to a medical data collection and analysis method, which comprises the following steps: 1, the original data will be uploaded to the data platform; 2, using conditional random fields and semantic dependency grammar based annotation algorithm converts the raw data into RDF format data; 3, through the data mining algorithm will be a step after treatment the data in the same patient RDF data associated with them and stored in a distributed file system based on Hbase database; 4, the use of statistical methods and machine learning methods to analyze the data in a Hbase database, draws the conclusion of the analysis conclusion; 5, sorting and classification, construction of knowledge base treatment. The present invention targeted collection personnel throughout the clinical data, based on a large amount of data analysis, make a clinical diagnosis, disease early warning and analysis of the patient's behavior in clinic can help doctors make more efficient, accurate and personalized treatment program.

【技术实现步骤摘要】

本专利技术涉及数据分析领域,具体涉及一种医疗数据采集分析方法及系统。
技术介绍
既往患者的数据无法跟随患者移动,不容易对患者进行跟踪随访,对于国内患者失访现象非常严重,这就是为什么我国临床试验研究起步和进展缓慢的根本原因,我国患者在全世界排第一,但是临床研究在世界上排不上号,正式因为患者的数据没有保存,无法对各种手术治疗方法进行比对,分析,无法提供有效的数据说明,严重阻碍了医学研究工作的开展,和医学事业的发展。
技术实现思路
本专利技术所要解决的技术问题是提供一种医疗数据采集分析方法及系统。本专利技术解决上述技术问题的技术方案如下:一种医疗数据采集分析方法,包括以下步骤:S1、将原始数据上传至数据平台;S2、采用基于条件随机域和依存语法相结合的语义标注算法将原始数据转换为RDF格式的数据;S3、通过数据挖掘算法将上一步处理后的数据中同一个病人的RDF数据关联起来并存储到基于分布式文件系统的Hbase数据库中;S4、利用统计方法和机器学习方法对Hbase数据库中的数据进行分析,得出分析结论;S5、对分析结论进行整理和分类,构建治疗方案知识库。在上述技术方案的基础上,本专利技术还可以做如下改进。进一步的,所述步骤S1的原始数据包括每一个患者的治疗方案、年龄段、手术结果、出院后的康复状况。进一步的,所述步骤S1之前,还包括在前置服务器上对原始数据进行筛选和整理的步骤。进一步的,所述步骤S4中的对Hbase数据库中的数据进行分析,包括预测治疗后能够取得的效果和评估治疗风险、根据不同病人的病情来制定个性化的治疗方案和分析不同手术方案对应的治疗效果。一种医疗数据采集分析系统,包括以下部分:数据平台,用于存储上传的原始数据;格式转换模块,用于采用基于条件随机域和依存语法相结合的语义标注算法将原始数据转换为RDF格式的数据;数据库存储模块,用于通过数据挖掘算法将上一步处理后的数据中同一个病人的RDF数据关联起来并存储到基于分布式文件系统的Hbase数据库中;统计分析模块,用于利用统计方法和机器学习方法对Hbase数据库中的数据进行分析,得出分析结论;治疗方案知识库构建模块,用于对分析结论进行整理和分类,构建治疗方案知识库。进一步的,所述数据平台存储的的原始数据包括每一个患者的治疗方案、年龄段、手术结果、出院后的康复状况。进一步的,还包括前置处理模块,用于前置服务器上对原始数据进行筛选和整理,并将处理后的数据发送给数据平台。进一步的,所述统计分析模块对Hbase数据库中的数据进行分析,包括预测治疗后能够取得的效果和评估治疗风险、根据不同病人的病情来制定个性化的治疗方案和分析不同手术方案对应的治疗效果。本专利技术的有益效果是:本专利技术有针对性的采集人员的整个临床诊疗数据,分布式的存储可以存储海量的医疗数据,通过对大量的有效数据进行分析,做出临床辅助诊断、疾病预警和分析患者的行为,在临床上可以帮助医生更好的根据患者的临床信息制定更加有效的、精确的、个性化的治疗方案。实现了将病人的多次、异地的诊疗信息自动关联起来。附图说明图1为本专利技术方法流程图;图2为本专利技术系统流程图。具体实施方式以下结合附图对本专利技术的原理和特征进行描述,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。本专利技术的医疗数据采集分析方法,包括以下步骤:在有条件部署前置服务器的地方,在前置服务器上部署数据采集工具,通过数据采集工具对数据进行整理和筛选后上传到数据平台;在没有条件部署前置服务器的地方,通过数据上报平台将数据上传到数据平台;由于上传到数据平台的数据既包含结构化数据,如检验结果,病人基本信息等,又包括非结构化数据,如检查结果,病史等,为了更好的对这些数据进行分析,本专利技术没有使用传统的关系模型来描述这些数据,而是采用了RDF来描述这些数据。为了将这些数据转换为RDF格式的数据,本专利技术采用了基于CRF(条件随机域)和依存语法相结合的语义标注算法将这些数据转换为RDF格式的数据;将这些RDF格式的数据进行分析,根据病人的基本信息通过数据挖掘算法将同一个病人的RDF数据关联起来存储到基于分布式文件系统的Hbase数据库中;运用统计方法,机器学习方法对Hbase数据库中的数据进行分析,得出数据中的规律,分析出数据的潜在意义;将分析后的数据运用在医疗领域,做出临床辅助诊断,帮助医生更好的根据患者的临床信息制定更加有效的、精确的、个性化的治疗方案。一种医疗数据采集分析系统,包括以下部分:数据平台,用于存储上传的原始数据;格式转换模块,用于采用基于条件随机域和依存语法相结合的语义标注算法将原始数据转换为RDF格式的数据;数据库存储模块,用于通过数据挖掘算法将上一步处理后的数据中同一个病人的RDF数据关联起来并存储到基于分布式文件系统的Hbase数据库中;统计分析模块,用于利用统计方法和机器学习方法对Hbase数据库中的数据进行分析,得出分析结论;治疗方案知识库构建模块,用于对分析结论进行整理和分类,构建治疗方案知识库。所述数据平台存储的的原始数据包括每一个患者的治疗方案、年龄段、手术结果、出院后的康复状况。本系统还包括前置处理模块,用于前置服务器上对原始数据进行筛选和整理,并将处理后的数据发送给数据平台。所述统计分析模块对Hbase数据库中的数据进行分析,包括预测治疗后能够取得的效果和评估治疗风险、根据不同病人的病情来制定个性化的治疗方案和分析不同手术方案对应的治疗效果。与现有技术相比,本专利技术具有以下的有益效果:(1)实现了医疗数据的海量存储;本专利技术采用了高可靠性、高性能、面向列、可伸缩的分布式存储系统Hbase,可以实现将海量的医疗数据存储起来,便于后面的分析。(2)实现了对非结构化数据的分析;为了有效的对非结构化的数据进行有效处理,本专利技术采用了基于CRF(条件随机域)和依存语法相结合的语义标注算法将非结构化数据转换为RDF格式的数据。(3)实现了将病人的多次、异地的诊疗信息自动关联起来本专利技术通过数据挖掘算法对标注后的RDF格式的数据进行关联分析,将同一个病人的多次、异地的诊疗信息关联起来存储到数据平台。以上所述仅为本专利技术的较佳实施例,并不用以限制本专利技术,凡在本专利技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发...

【技术保护点】
一种医疗数据采集分析方法,其特征在于,包括以下步骤:S1、将原始数据上传至数据平台;S2、采用基于条件随机域和依存语法相结合的语义标注算法将原始数据转换为RDF格式的数据;S3、通过数据挖掘算法将上一步处理后的数据中同一个病人的RDF数据关联起来并存储到基于分布式文件系统的Hbase数据库中;S4、利用统计方法和机器学习方法对Hbase数据库中的数据进行分析,得出分析结论;S5、对分析结论进行整理和分类,构建治疗方案知识库。

【技术特征摘要】
1.一种医疗数据采集分析方法,其特征在于,包括以下步骤:
S1、将原始数据上传至数据平台;
S2、采用基于条件随机域和依存语法相结合的语义标注算法将原始数据
转换为RDF格式的数据;
S3、通过数据挖掘算法将上一步处理后的数据中同一个病人的RDF数据
关联起来并存储到基于分布式文件系统的Hbase数据库中;
S4、利用统计方法和机器学习方法对Hbase数据库中的数据进行分析,
得出分析结论;
S5、对分析结论进行整理和分类,构建治疗方案知识库。
2.根据权利要求1所述的医疗数据采集分析方法,其特征在于,所述步
骤S1的原始数据包括每一个患者的治疗方案、年龄段、手术结果、出院后的
康复状况数据。
3.根据权利要求1所述的医疗数据采集分析方法,其特征在于,所述步
骤S1之前,还包括在前置服务器上对原始数据进行筛选和整理的步骤。
4.根据权利要求1所述的医疗数据采集分析方法,其特征在于,所述
步骤S4中的对Hbase数据库中的数据进行分析,包括预测治疗后能够取得
的效果和评估治疗风险、根据不同病人的病情来制定个性化的治疗方案和分
析不同手术方案对应的治疗效果。
5.一种医疗数据采集分析系统,其特征在于,包括以下部...

【专利技术属性】
技术研发人员:王国斌汤绍涛李国新陶凯雄董蒨丁克峰蔡开琳童强松庄伟
申请(专利权)人:华中科技大学同济医学院附属协和医院
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1