基于存在于自由文本临床文档中的临床概念之间的语义关系来将文档建模为层次图状数据结构的系统和方法技术方案

技术编号:20290215 阅读:14 留言:0更新日期:2019-02-10 20:34
本公开涉及基于存在于自由文本临床文档中的临床概念之间的语义关系来将所述文档建模为层次图状数据结构。一种方法包括解析、识别并且标注自由文本临床文档内的临床术语。这通过将识别的临床术语存储在概念节点中来完成。所述概念节点是具有用于对存储的概念进行归类的属性的集合的数据结构。自由文本临床文档的临床概念被分类为临床事件类别。所述自由文本临床文档包括与临床概念种类相关联的临床术语。对临床概念进行分类包括将自由文本临床文档组织为描述自由文本临床文档的特定方面的节段,所述自由文本临床文档包括所述文档的临床方面、技术方面或者管理方面中的一个或多个。提供临床概念之间的链接,使得个体临床概念对应于个体概念节点。

【技术实现步骤摘要】
【国外来华专利技术】基于存在于自由文本临床文档中的临床概念之间的语义关系来将文档建模为层次图状数据结构的系统和方法
本公开涉及用于基于存在于自由文本临床文档中的临床概念之间的语义关系来将文档建模为层次图状数据结构的系统和方法。
技术介绍
众所周知,对电子健康记录(EHR)的增加的采用已经导致以电子格式存储的前所未有的数量的对象健康信息。然而,压倒性的大型记录的可用性也已经引起了对信息超载的关注,以及对临床工作的潜在的负面影响,诸如遗漏错误、延迟和总体对象安全性。自由文本临床笔记(或者文档)是作为对象的医学记录的一部分的笔记。它们被用于在门诊患者护理或者住院的过程期间记载对象的临床状态和其中的变化。自由文本临床笔记可以示出对象的进展、改善或者其缺乏。它们可用于健康护理提供者持续不断地参考和编辑。自由文本是非结构化数据。可以在文字处理文件、电子邮件等中找到自由文本。EHR不仅被称为电子健康记录,并且有时被称为电子医学记录(EMR)。EHR系统是辅助对对象健康(或者医学)数据和/或记录的收集和操纵的计算机系统。这些记录通常包括数据,该数据包括以下项中的一个或多个:医学历史、测试结果、过敏反应、免疫状态、放射学和/或其他图像、生命体征、人口统计信息、对象统计信息、账单信息和/或其他数据。当前EHR系统缺乏捕获并且语义地测量自由文本临床笔记中的临床概念的能力,该能力使得能够以支持临床工作流和认知临床推理的方式在该大量的对象数据中进行搜索、比较和聚类,以及使得该信息能够被用于研究和教育目的。
技术实现思路
因此,本公开的一个方面涉及一种被配置用于基于存在于自由文本临床文档中的临床概念之间的语义关系来将所述文档建模为层次图状数据结构的系统。所述系统包括一个或多个硬件处理器,所述一个或多个硬件处理器由机器可读指令配置为使用自然语言处理用于解析、识别并且标注自由文本临床文档内的临床术语。这通过将识别的临床术语存储在概念节点中完成。所述概念节点是具有用于对存储的概念进行归类的属性的集合的数据结构。自由文本临床文档的临床概念被分类为临床事件类别。所述自由文本临床文档包括与临床概念种类相关联的临床术语。对临床概念进行分类包括将自由文本临床文档组织为描述所述自由文本临床文档的特定方面的节段,所述自由文本临床文档包括所述文档的临床方面、技术方面或者管理方面中的一个或多个。提供临床概念之间的链接,使得个体临床概念对应于个体概念节点。所述链接是概念边。所述概念边具有进一步表征对应的临床节点对之间的关系的属性。表征所述关系包括(1)使用临床概念之间的语义关系来计算所述概念边并且(2)提供边分数来指示两个临床概念之间的相似性。本公开的另一方面涉及一种用于被配置用于基于存在于自由文本临床文档中的临床概念之间的语义关系来将所述文档建模为层次图状数据结构的系统的方法。所述方法包括解析、识别并且标注自由文本临床文档内的临床术语。这通过将识别的临床术语存储在概念节点中来完成。所述概念节点是具有用于对存储的概念进行归类的属性的集合的数据结构。自由文本临床文档的临床概念被分类为临床事件类别。所述自由文本临床文档包括与临床概念种类相关联的临床术语。对临床概念进行分类包括将自由文本临床文档组织为描述所述自由文本临床文档的特定方面的节段,所述自由文本临床文档包括所述文档的临床方面、技术方面或者管理方面中的一个或多个。提供临床概念之间的链接,使得个体临床概念对应于个体概念节点。所述链接是概念边。所述概念边具有进一步表征对应的临床节点对之间的关系的属性。表征所述关系包括(1)使用临床概念之间的语义关系来计算所述概念边并且(2)提供边分数来指示两个临床概念之间的相似性。本公开的又一方面涉及一种被配置用于被配置用于基于存在于自由文本临床文档中的临床概念之间的语义关系来将所述文档建模为层次图状数据结构的系统的系统。所述系统包括用于解析、识别并且标注自由文本临床文档内的临床术语的单元。这通过将识别的临床术语存储在概念节点中来完成。所述概念节点是具有用于对存储的概念进行归类的属性的集合的数据结构。自由文本临床文档的临床概念被分类为临床事件类别。所述自由文本临床文档包括与临床概念种类相关联的临床术语。对临床概念进行分类包括将自由文本临床文档组织为描述所述自由文本临床文档的特定方面的节段,所述自由文本临床文档包括所述文档的临床方面、技术方面或者管理方面中的一个或多个。提供临床概念之间的链接,使得个体临床概念对应于个体概念节点。所述链接是概念边。所述概念边具有进一步表征对应的临床节点对之间的关系的属性。表征所述关系包括(1)使用临床概念之间的语义关系来计算所述概念边并且(2)提供边分数来指示两个临床概念之间的相似性。本专利技术的这些和其他特征和特性以及结构的相关元件的操作方法和功能以及各部分的组合和制造的经济性将在参考附图考虑以下描述和权利要求书后变得更加明显,附图全部形成本说明书的一部分,其中,类似的附图标记指代各个附图中的对应的部分。然而,应明确地理解,附图仅出于说明和描述的目的并且不旨在作为对本专利技术的界限的定义。附图说明图1图示了根据一个或多个实施例的被配置用于基于存在于自由文本临床文档中的临床概念之间的语义关系来将文档建模为层次图状数据结构的系统。图2是根据一个或多个实施例的openEHR对象护理过程表示的示意图。图3图示了根据一个或多个实施例的部件的流水线。图4图示了根据一个或多个实施例的描绘的临床概念标注器和临床概念链接器。图5图示了根据一个或多个实施例的放射学报告的节段的范例。图6图示了一个或多个实施例的将文档中的临床概念分类为临床事件类别的范例。图7图示了根据一个或多个实施例的与用于创建临床概念之间的链接的临床概念链接引擎有关的链接。图8图示了根据一个或多个实施例的利用临床概念链接引擎来创建临床概念之间的链接的范例。图9图示了根据一个或多个实施例的用于基于存在于自由文本临床文档中的临床概念之间的语义关系来将文档建模为层次图状数据结构的方法。具体实施方式如在本文中所使用的,单数形式的“一”、“一个”和“该”包括多个指代,除非在上下文中清楚地另有指定。如在本文中所使用的,两个或更多部分或部件被“耦合”的表述应意指所述部分被直接或间接地(即,通过一个或多个中间部分或部件)结合在一起或一起运行,只要发生链接。如在本文所使用的,“直接耦合”意指两个元件直接彼此接触。如在本文所使用的,“固定地耦合”和“固定的”意指两个部件被耦合从而作为一体移动,同时维持相对于彼此的恒定取向。如在本文中所使用的,词语“单式”意指将部件创建为单件或单元。也就是说,包括单独创建并之后耦合在一起作为单元的多个件的部件不是“单式”部件或体。如在本文中所采用的,两个或更多个部分或部件彼此“接合”的表述意指所述部分直接地或通过一个或多个中间部分或部件而对彼此施力。如在本文中所采用的,术语“数量”应意指一或大于一的整数(即,多个)。本文中所使用的方向性用语,例如,通过举例而非限制性的,顶部、底部、左、右、上、下、前、后以及由此衍生词,涉及附图中示出的元件的取向,并非限制权利要求,除非其中明确记载。确定从自由文本文档提取的两个个体概念或者两组概念之间的相似性对于生物医学的各方面而言是重要的,例如,以找到与当前临床上下文本文档来自技高网...

【技术保护点】
1.一种被配置用于基于存在于自由文本临床文档中的临床概念之间的语义关系来将所述文档建模为层次图状数据结构的系统,所述系统包括:一个或多个硬件处理器,其由机器可读指令配置为:使用自然语言处理用于解析、识别并且标注自由文本临床文档内的临床术语;将识别的临床术语存储在概念节点中,所述概念节点是具有用于对存储的概念进行归类的属性的集合的数据结构;将自由文本临床文档的临床概念分类为临床事件类别,所述自由文本临床文档包括与临床概念种类相关联的临床术语,其中,对临床概念进行分类包括将自由文本临床文档组织为描述所述自由文本临床文档的特定方面的节段,所述自由文本临床文档包括所述文档的临床方面、技术方面或者管理方面中的一个或多个;并且提供临床概念之间的链接,使得个体临床概念对应于个体概念节点,所述链接是概念边,所述概念边具有进一步表征对应的临床节点对之间的关系的属性,其中,表征所述关系包括(1)使用临床概念之间的语义关系来计算所述概念边并且(2)提供边分数来指示两个临床概念之间的相似性。

【技术特征摘要】
【国外来华专利技术】2016.05.27 US 62/3422311.一种被配置用于基于存在于自由文本临床文档中的临床概念之间的语义关系来将所述文档建模为层次图状数据结构的系统,所述系统包括:一个或多个硬件处理器,其由机器可读指令配置为:使用自然语言处理用于解析、识别并且标注自由文本临床文档内的临床术语;将识别的临床术语存储在概念节点中,所述概念节点是具有用于对存储的概念进行归类的属性的集合的数据结构;将自由文本临床文档的临床概念分类为临床事件类别,所述自由文本临床文档包括与临床概念种类相关联的临床术语,其中,对临床概念进行分类包括将自由文本临床文档组织为描述所述自由文本临床文档的特定方面的节段,所述自由文本临床文档包括所述文档的临床方面、技术方面或者管理方面中的一个或多个;并且提供临床概念之间的链接,使得个体临床概念对应于个体概念节点,所述链接是概念边,所述概念边具有进一步表征对应的临床节点对之间的关系的属性,其中,表征所述关系包括(1)使用临床概念之间的语义关系来计算所述概念边并且(2)提供边分数来指示两个临床概念之间的相似性。2.根据权利要求1所述的系统,其中,所述一个或多个硬件处理器还由机器可读指令配置为使用正则表达式和医学本体论中的一个或两者用于解析、识别并且标注自由文本临床文档内的临床概念。3.根据权利要求1所述的系统,其中,所述临床概念种类包括临床发现、症状、诊断、流程或者解剖结构中的一个或多个。4.根据权利要求1所述的系统,其中,所述一个或多个硬件处理器还由机器可读指令配置为使所述临床事件类别基于包括openEHR和SOAP中的一个或两者的临床模型来将概念组织为层次种类。5.根据权利要求1所述的系统,其中,所述一个或多个硬件处理器还由机器可读指令配置为执行对自由文本临床文档中的临床概念的上下文敏感的分析。6.一种用于基于存在于自由文本临床文档中的临床概念之间的语义关系来将所述文档建模为层次图状数据结构的方法,所述方法包括:使用自然语言处理用于解析、识别并且标注自由文本临床文档内的临床术语;将识别的临床术语存储在概念节点中,所述概念节点是具有用于对存储的概念进行归类的属性的集合的数据结构;将自由文本临床文档的临床概念分类为临床事件类别,所述自由文本临床文档包括与临床概念种类相关联的临床术语,其中,对临床概念进行分类包括将自由文本临床文档组织为描述所述自由文本临床文档的特定方面的节段,所述自由文本临床文档包括所述文档的临床方面、技术方面...

【专利技术属性】
技术研发人员:L·D·M·奥利韦拉D·H·特奥多罗
申请(专利权)人:皇家飞利浦有限公司
类型:发明
国别省市:荷兰,NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1