The invention discloses a structured processing method of clinical documents based on an Internet integrated medical platform, which involves the technical field of Internet medical platform. The unstructured clinical documents are input into the structured processing engine of clinical documents, and are processed by means of clinical medical corpus, rules, full-text retrieval and machine learning, and the structured data is output to the distributed storage engine. Processing by artificial intelligence algorithm for platform analysis and display. The present invention is based on the structured processing method of clinical documents in the Internet integrated medical platform. The unstructured text data in the clinical data is structured and stored in the distributed Hadoop cluster. The distributed data storage mode and distributed computing processing are realized. The programming in the software application is modified and adapted to the distributed characteristics.
【技术实现步骤摘要】
基于互联网一体化医疗平台的临床文档结构化处理方法
本专利技术涉及互联网医疗平台
,更具体地指一种基于互联网一体化医疗平台的临床文档结构化处理方法。
技术介绍
大数据作为一种重要的资源,已经不同程度地渗透到每个行业和部门,其深度应用不仅有助于各单位的经营活动,也有利于推动国民经济的发展。“互联网+”是工业和信息化深度融合的成果与标志,也是进一步促进信息消费的重要抓手。所谓“互联网+”就是“互联网+各个传统行业”,但这并不是简单的两者相加,而是利用信息通信技术以及互联网平台,让互联网与传统行业进行深度融合,创造新的发展生态。未来互联网也会像电一样,作为一种生产力工具,给每个行业带来效率的大幅提升。推动移动互联网、云计算、大数据、物联网等与现代制造业结合,促进电子商务、工业互联网和互联网金融健康发展,引导互联网企业拓展国际市场。”传统集市+互联网有了众多的电商,相应的也产生了诸如传统百货卖场+互联网,传统银行+互联网,传统交通+互联网。“互联网+”正在全面应用到第三产业,形成了诸如互联网医疗、互联网金融、互联网交通、互联网教育等新业态。医疗事业是国民经济和社会发展 ...
【技术保护点】
1.基于互联网一体化医疗平台的临床文档结构化处理方法,其特征在于:包括以下步骤,S1、临床文档结构化处理引擎接收非结构化临床文档的输入,通过临床医学语料库、规则、全文检索及机器学习等手段,将非结构化的文本数据转化为结构化的样本与指标数据;S2、临床文档经过结构化处理引擎处理之后,得到的结构化数据即样本与指标的键值对,存储到分布式存储引擎中,以供平台的分析、展示。
【技术特征摘要】
1.基于互联网一体化医疗平台的临床文档结构化处理方法,其特征在于:包括以下步骤,S1、临床文档结构化处理引擎接收非结构化临床文档的输入,通过临床医学语料库、规则、全文检索及机器学习等手段,将非结构化的文本数据转化为结构化的样本与指标数据;S2、临床文档经过结构化处理引擎处理之后,得到的结构化数据即样本与指标的键值对,存储到分布式存储引擎中,以供平台的分析、展示。2.如权利要求1所述的基于互联网一体化医疗平台的临床文档结构化处理方法,其特征在于,所述临床文档结构化处理引擎包括中文自然语言处理模块、临床医学语料库构建模块、样本指标提取模块,中文自然语言处理模块分别于临床医学语料库构建模块、样本指标提取模块相连。3.如权利要求2所述的基于互联网一体化医疗平台的临床文档结构化处理方法,其特征在于,所述中文自然语言处理模块利用中文自然语言处理技术,从词、句、段落层次对输入的临床文档进行处理,处理步骤如下:(1)切分短句:根据临床文档的文本叙述特点,利用文句的表达规则,将临床文档的文本内容切分为一个个描述样本的短句;(2)中文分词:利用中文分词工具,基于通用医学词库和临床医学词库,对样本短句进行分词,得到有意义的词或者词组;(3)词性分析:分析每个词的词性;(4)句法分析:对于具体的样本短句,将其与临床文档中描述同一样本的短句进行比较,总结归纳出每种样本描述的短句句法。4.如权利要求2所述的基于互联网一体化医疗平台的临床文档结构化处理方法,其特征在于,所述临床医学语料库构建模...
【专利技术属性】
技术研发人员:高建强,赵戈,徐龙章,
申请(专利权)人:上海众恒信息产业股份有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。