用于分析医疗保健数据的系统和方法技术方案

技术编号:17959387 阅读:54 留言:0更新日期:2018-05-16 05:15
系统、方法和软件产品分析医疗保健数据。从第一源收集第一输入数据,从与第一源不同的第二源收集第二输入数据。第二源具有与第一源的格式不同的数据格式。处理第一输入数据以确定第一概念,并且处理第二输入数据以确定第二概念。确定第一概念和第二概念之间的关系。基于所述关系将第一概念和第二概念存储在知识库中,并且从知识库生成患者医学模型。

Systems and methods used to analyze health care data

Systems, methods and software products are used to analyze health care data. The first input data is collected from the first source, and second input data are collected from the second source different from the first source. The second source has different data formats from the first source format. The first input data is processed to determine the first concept, and the second input data is processed to determine the second concept. Determine the relationship between the first concept and the second concept. Based on the relationship, the first concept and the second concept are stored in the knowledge base, and the patient medical model is generated from the knowledge base.

【技术实现步骤摘要】
【国外来华专利技术】用于分析医疗保健数据的系统和方法相关申请本申请要求于2015年7月21日提交的题为“SystemsandMethodsforAnalyzingHealthcareData(用于分析医疗保健数据的系统和方法)”、序列号为62/194,920的美国专利申请的优先权,并且通过引用将其全部内容并入本文。
技术介绍
在现代医疗保健计算机化中,医生经常在下述方面受到限制,可将什么信息提供给医疗保健计算机和其他数字信息系统以及其中的什么信息可用。医疗保健计算机和现代范围的数字设备大多提供数据输入表格,要求以特定格式在特定空间内手动输入信息;例如,医生使用键盘将条目打字输入或指定到预定义的文本数据字段中。医生为每位患者分配的时间量由多年来已经改变的许多问题所驱使,这些问题包括:增加患者护理工作量,慢性疾病状况和经济环境方面的增加,从而能够为每位患者支付保险费用。因此,医生通常具有患者数量增加的负担,减少了花费在每个患者上的时间,并且减少了输入到电子病历中的可用数据量。过去,医生会对典型的诊所就诊花费30至60分钟的时间。在美国这个时间现在减少到平均10分钟,而且在世界其他若干国家甚至更少。同样地,在医院或门诊甚至在出诊的家庭或现场,现在所花费的时间通常比过去几年短。医疗保健就诊(无论是诊所、门诊、医院、家庭、现场或者提供医疗保健的任何其他地点)的作用对于获得相关信息以管理、引导和指导提供护理以及提高护理的准确性都至关重要。多年来,研究反复证明,尽管复杂精密的诊断设备、仪器、检验室测试、成像系统等的可用性增加了,但是病史采集、医生或卫生工作者询问问题(关于症状和体征)才是护理发展前进最重要的因素。研究已经清楚地表明,超过70%的诊断和护理步骤的进步源自医生或卫生工作者对患者的询问。因此,医生使用非计算机化信息(例如:患者所说的话,患者的外观和动作,患者如何表现行为,患者如何就座,患者如何走路,患者的气味,医生在一对一的患者就诊和咨询时所获得的其他信息)对患者进行约百分之七十的正确诊断。但是这些信息并不被医疗保健计算机或其他数字或其他数据系统所知晓。例如,在同一位医生连续咨询患者的情况下,医生对以往咨询的记忆、心理视野以及重建最有助于确定患者的健康是否恶化、改变或改善以及目前的治疗是否有效。在不同的医生咨询患者的情况下,以往咨询的信息往往无法获得,而新接手的医生对患者的情况了解不太全面。目前,现代医疗保健通过共同地给患者提供护理的许多不相连接的服务得以实现。每项服务都会收集并存储其数据以供将来使用,但其中只有一部分与其他服务共享。此外,如本文所讨论的,在随附文件“专利1”中,存在许多有价值的数据,例如,患者就诊时所呈现的可获得和有价值的患者外观、声音和气味,但是它们目前很大程度上由医疗保健提供者所感知,并且不被转换以用于捕获和数字化转换。每项服务所收集的大量信息也是其他服务无法使用的,这是因为数据往往来自不同的情境,而且格式不易转换和吸收。由于数据本质上是“竖井式的(siloed)”,因此护理患者的关键因素常常会丢失,导致额外的手术、额外的医院就诊以及患者和医疗机构的额外费用。
技术实现思路
在一个实施例中,一种方法分析医疗保健数据。从第一源收集第一输入数据,从与第一源不同的第二源收集第二输入数据。第二源具有与第一源的格式不同的数据格式。处理第一输入数据以确定第一概念,并且处理第二输入数据以确定第二概念。确定第一概念和第二概念之间的关系。基于所述关系将第一概念和第二概念存储在知识库中,并且从知识库生成患者医学模型。在另一实施例中,一种方法分析医疗保健数据。从多个不同源接收输入数据。从输入数据中提取文本并使用自然语言处理(NLP)处理文本以确定多个概念,每个概念基于从文本导出的理解和情感。确定每个概念之间的关系,并从多个概念导出高级概念。多个概念和高级概念中的每个都基于所述关系存储在数据库中。处理输入数据以确定与医疗保健相关的概念。将每个概念中的信息进行归一化,并通过使用NLP、语义分析和推理提取来从医疗保健数据中提取直接概念。派生概念是从直接概念导出的,且直接概念和派生概念存储在概念库中以形成知识库。在另一实施例中,一种系统分析医疗保健数据。该系统包括:多个换能器,可操作以从不同源收集医疗保健数据;自然语言处理(NLP)和语义引擎,用于识别医疗保健数据中的直接概念;转换器,实现为由数字处理器执行的机器可读指令,用于接收和转换医疗保健数据以形成具有与患者相关联的信息的数据库;分析器,被实现为由数字处理器执行的机器可读指令,用于处理数据库以生成患者的健康状态。在另一实施例中,一种软件产品具有存储在非暂时性计算机可读介质上的指令,其中所述指令在由计算机执行时执行分析医疗保健数据的步骤。所述指令包括:用于从第一源收集第一输入数据的指令;用于从不同于第一源的第二源收集第二输入数据的指令,第二源具有不同于第一源的格式的数据格式;用于处理第一输入数据和第二输入数据以分别确定第一概念和第二概念的指令;用于确定第一概念与第二概念之间的关系的指令;用于基于所述关系将第一概念和第二概念存储在知识库内的指令;用于从知识库生成患者医学模型的指令。在另一实施例中,一种软件产品具有存储在非暂时性计算机可读介质上的指令,其中所述指令在由计算机执行时执行分析医疗保健数据的步骤。这些指令包括:用于从多个不同源接收输入数据的指令;用于从输入数据提取文本的指令;用于使用自然语言处理(NLP)来处理文本以确定多个概念的指令,每个概念基于从文本导出的理解和情感;用于确定每个概念之间的关系的指令;用于基于所述类别将多个概念和高级概念中的每个存储在数据库内的指令;用于从多个概念导出高级概念的指令;用于基于所述类别将多个概念和高级概念中的每个存储在数据库内的指令;用于处理输入数据以确定与医疗保健有关的概念的指令;用于对每个概念中的信息进行归一化的指令;用于通过使用NLP、语义分析和推理提取来从医疗保健数据中提取直接概念的指令;用于从直接概念导出派生概念的指令;用于将直接概念和派生概念存储在概念库中以形成知识库的指令。附图说明图1示出实施例中用于分析医疗保健数据的一个示例性系统。图2进一步示例性地示出了图1的系统。图3示出了实施例中根据图1的输入数据的图2的概念的示例性构造。图4示出了实施例中的图1的分析器,其中预测器与信息门户接口交互以接收来自询问器的查询。图5是示出通过预测器示例性生成图4的概念图的示意图。图6是示出实施例中的短语提取和概念识别工具的示例性初始化的示意图。图7是示出实施例中用于生成概念、短语、元数据、关系和患者数据的示例性核心语义算法的示意图。图8示出了词语和概念的示例性分类。图9示出了实施例中图2的NLP和语义引擎的示例性操作。图10是示出实施例中由事件处理引擎示例性自动更新图2的知识库的示意图。图11是示出实施例中用于分析医疗保健数据的一个示例性方法的流程图。图12是示出实施例中由事件处理引擎示例性自动更新图2的知识库的示意图。图13示出了实施例中图12的知识库,其中示例性数据示出了动态添加概念的能力以及需要创建事件以将概念添加在新类别内。图14是示出实施例中用于初始化图1的系统的一个示例性方法的流程图。图15是示出实施例中用于更新图2的知识库本文档来自技高网
...
用于分析医疗保健数据的系统和方法

【技术保护点】
一种分析医疗保健数据的方法,包括:从第一源收集第一输入数据;从不同于所述第一源的第二源收集第二输入数据,所述第二源具有不同于所述第一源的格式的数据格式;处理所述第一输入数据以确定第一概念;处理所述第二输入数据以确定第二概念;确定所述第一概念与所述第二概念之间的关系;基于所述关系将所述第一概念和所述第二概念存储在知识库内;以及从所述知识库生成患者医学模型。

【技术特征摘要】
【国外来华专利技术】2015.07.21 US 62/194,9201.一种分析医疗保健数据的方法,包括:从第一源收集第一输入数据;从不同于所述第一源的第二源收集第二输入数据,所述第二源具有不同于所述第一源的格式的数据格式;处理所述第一输入数据以确定第一概念;处理所述第二输入数据以确定第二概念;确定所述第一概念与所述第二概念之间的关系;基于所述关系将所述第一概念和所述第二概念存储在知识库内;以及从所述知识库生成患者医学模型。2.根据权利要求1所述的方法,处理所述第一输入数据的步骤包括基于医疗保健矩阵对所述第一输入数据内的医疗保健数据进行归一化;以及处理所述第二输入数据的步骤包括基于所述医疗保健矩阵对所述第二输入数据内的所述医疗保健数据进行归一化;其中,所述第一概念和所述第二概念具有允许比较的格式。3.根据权利要求1所述的方法,确定所述关系的步骤包括确定所述第一概念和所述第二概念中每一个的医疗保健类别,所述关系基于所述医疗保健类别。4.根据权利要求1所述的方法,其中,所述第一输入数据和所述第二输入数据中的至少一个包括非语言信息。5.一种分析医疗保健数据的方法,包括:从多个不同源接收输入数据;从所述输入数据中提取文本;使用自然语言处理(NLP)处理所述文本以确定多个概念,每个概念基于从所述文本导出的理解和情感;确定所述概念中的每个之间的关系;从所述多个概念导出高级概念;基于所述关系将所述概念和所述高级概念中的每个存储在数据库中;处理所述输入数据以确定与医疗保健相关的概念;对所述概念中的每个中的信息进行归一化;通过使用NLP、语义分析和推理提取来从所述医疗保健数据中提取直接概念;从所述直接概念导出派生概念;以及将所述直接概念和所述派生概念存储在概念库中以形成知识库。6.根据权利要求5所述的方法,确定所述关系的步骤包括:确定所述概念中的每个的情境;和确定所述概念中的每个的类别;其中,所述关系基于所述情境和所述类别中的一者或两者。7.根据权利要求5所述的方法,还包括处理所述知识库以预测患者行为和医疗保健事件。8.根据权利要求7所述的方法,所述处理步骤包括:从所述概念库中选择某些概念;将所选择的概念绘制在概念图上;和处理所述概念图以预测所述患者行为和医疗保健事件。9.根据权利要求5所述的方法,还包括周期性地重复接收、提取、导出和存储的步骤以维护所述概念库。10.根据权利要求5所述的方法,还包括从多个互联网源检索医疗保健数据,所述数据库包括医疗保健数据学习。11.根据权利要求5所述的方法,所述归一化步骤包括基于医疗保健矩阵对所述概念内的信息进行归一化。12.根据权利要求5所述的方法,其中,所述输入数据包括语言信息和非语言信息二者。13.根据权利要求4所述的方法,所述数据是询问数据、诱发数据、检测数据、症状数据、体征数据、检验室数据、成像数据、测试数据和感官数据中的至少一个。14.一种分析医疗保健数据的系统,包括:多个换能器,能操作以从不同的源收集医疗保健数据;自然语言处理(NLP)和语义引擎,用于识别所述医疗保健数据中的直接概念;转换器,实现为由数字处理器执行的机器可读指令,用于接收和转换所述医疗保健数据以形成具有与所述患者相关的信息的数据库;以及分析器,实现为由数字处理器执行的机器可读指令,用于处理所述数据库以生成所述患者的健康状态。15.根据权利要求15所述的系统,还包括:触发规则引擎,用于基于所述医疗保健数据的语言专用的语言规则来识别所述直接概念。16.一种包括存储在非暂时性计算机可读介质上的指令的软件产品,其中所述指令在由计算机执行时执行分析医疗保健数据的步...

【专利技术属性】
技术研发人员:马文·J·斯莱皮恩福阿德·拉赫曼阿里吉特·米特拉
申请(专利权)人:代表亚利桑那大学的亚利桑那校董会
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1