用于从临床文档进行语义搜索和提取相关概念的系统和方法技术方案

技术编号:16672917 阅读:21 留言:0更新日期:2017-11-30 17:19
当基于其语义意义来执行针对相关的临床概念的语义搜索时,语义搜索引擎框架采用接收关键词搜索信息(14)的客户网络界面(12)(例如浏览器)和与语义分析引擎(18)通信的网络服务器(16)。自然语言处理(NLP)引擎(服务器)(22)接收并存储临床注释和信息(24),从临床注释提取临床概念并将其存储在NoSQL数据库(26)中。NLP引擎将非结构化自由文本注释转换为结构化的可操作数据。语义分析引擎分析用户输入的关键词,将其映射到UMLS概念,并且基于一个或多个关系知识源来识别相关的概念。网络服务器在NoSQL数据库中搜索相关的概念ID,并返回相关注释和概念的列表(28),以供用户显示和选择。

【技术实现步骤摘要】
【国外来华专利技术】用于从临床文档进行语义搜索和提取相关概念的系统和方法
本专利技术具体应用于患者医疗保健数据系统和方法中。然而,应当理解,所描述的技术也可以应用于其他文档管理系统、其他数据管理技术等。
技术介绍
随着越来越多的患者健康记录变为数字化,已经对临床概念提取做了大量工作,临床概念提取将临床记录映射到统一的医学术语,诸如UMLS、SNOMED-CT。这样的工作将非结构化自由文本临床记录转换成结构化的编码的格式,其更适合进一步的信息检索,包括搜索功能。当前的临床搜索引擎主要是基于简单的关键词匹配。在过去的几十年中,学术界和工业界内的临床研究兴趣越来越集中于提取重要的患者细节,例如来自临床文档的发现和问题,从而朝向改进患者护理的质量。这些临床文档主要包括自由文本(叙述),其提供超过和高于结构化备选(诸如实验室数据和生命体征)的重要信息。然而,这些文档常常会在广泛的时段上突出显示患者的医疗保健使用,并且包含大量的信息,其可以超出阅读和使用文档的医疗保健提供者的认知能力。采用用于从临床文档提取信息的各种NLP技术的著名项目包括医学语言提取和编码系统(MEDLEE)和MetaMap,其已经被用于将临床和生物医学文本内的概念映射到统一医学语言系统(UMLS)。此外,共享的任务和挑战,例如整合生物学和床边(i2b2)挑战的信息学通过提供对针对临床领域的在其他情况下昂贵的注释语料库的访问来促进与临床概念提取相关的各种NLP任务。不管在针对旨在编制整个临床文档并检索特定的患者信息(例如检测急性呼吸道感染)的临床NLP的模块上的若干同行查看的文献,集中于将NLP技术应用于优化远程医疗相关的工作流程内的临床文档的使用的项目尚未严谨地被探索。远程医疗领域的相关工作提出了虚拟网络,其使用NLP来检索巴基斯坦医疗保健系统内的朝向对患者询问的临床决策支持的体征和症状。然而,该虚拟网络并不关注与临床医师(特别是护士和医师)对自由文本临床文档的消费有关的工作流优化。常规工作流程优化方法涉及临床医师手动从电子健康记录(EHR)系统(例如EPIC,Cerner等)内的临床文档检索活动(未解决)的诊断。与手动检索活动诊断相关联的信息过载和认知负担常常使临床医师的工作流程复杂化,其中,产生的复杂性导致次优信息综合;来自对调查进行重新排序以评价先前可能己经记录的诊断的增加的医疗保健成本;以及由于尚未检索但是可用的患者数据的增加的临床护理中的错误风险。不管过去几年中语义搜索技术(例如综合的基于领域的本体论、信息提取方法和推理引擎)的成熟,临床信息学行业尚未产生提供语义搜索功能以支持日常医疗保健任务和临床研究的公知的信息检索应用。已经使用具有临床领域的显著覆盖的知识资源(如统一医学语言系统(UMLS))来降低临床概念的复杂性并且基于语义类型来对这些概念进行归类。然而,仍然需要进行许多工作来有效地利用嵌入在这些知识源中的关系来促进上下文感知的患者信息的导航和面向研究的查看。在放射学领域,称为NuancePowerScribe的语音识别和听写软件提供了MontageTM插件,其实现患者信息的搜索驱动的分析以支持质量评价。然而,该插件不提供很多所需要的上下文感知的、语义相关的搜索结果,其在放射学领域之内和之外两者对于大量的自由文本患者报告的导航和面向研究的查看有用。本申请提供了新的和改进的系统和方法,其有助于从电子临床文档自动提取活动诊断,从而克服了上述问题和其他问题。
技术实现思路
根据一个方面,一种便于基于关键词的语义意义来使用用户输入的关键词搜索相关的临床概念的系统,包括:客户网络(web)界面,其接收关键词搜索信息;以及语义分析引擎,其经由网络服务器接收所述关键词搜索信息并且经由MySQLTM数据库与自然语言处理(NLP)引擎进行通信。所述NLP引擎接收并存储临床注释和信息并且从所述临床注释提取临床概念,并将所述临床概念存储到NoSQL数据库中。所述语义分析引擎分析所述关键词搜索信息,将关键词映射到至少一个UMLS概念,基于一个或多个关系知识源来识别和检索一个或多个相关的概念。所述网络服务器在所述NoSQL数据库中搜索所述相关的概念,并且将相关注释和概念的列表返回到所述网络服务器,以用于经由所述客户网络界面显示给用户。根据另一方面,一种从电子临床文档自动提取活动诊断的方法,包括:接收在患者护理期间生成的自由文本电子文档;识别具有活动诊断的文档部分;识别所识别的部分内的至少一个名词短语(NP)终端;并且根据每个NP终端生成双联词的集合。所述方法还包括:使用所述双联词来查询数据库;基于级联的字符来识别候选活动诊断;基于句法、语义和层级特征来选择与所述NP终端最相似的候选活动诊断;并且呈现从所述自由文本文档提取的活动诊断的列表。此外,所述方法还包括分析与在所述NP终端内识别的概念内的词语的分级树相比较的表示与每个候选活动诊断内的词语相关联的关系的分级树,以评价给定的活动诊断与NP终端概念之间的语义相关性。根据另一方面,一种便于基于关键词的语义意义来呈现与用户输入的关键词有关的临床概念的图形用户界面,包括:关键词字段,用户经由所述关键词字段输入或选择一个或多个关键词;结果面板,其显示与一个或多个关键词在语义上有关的突出显示的标注的临床概念的列表;以及本体面板,其显示针对用户选定的临床概念的本体派生的树。所述图形用户界面还包括:一个或多个可展开和可折叠的报告部分,其在被展开时向用户提供针对与所述用户选定的临床概念相关联的完整临床报告的可选择链接。在阅读和理解了下面的详细描述之后,本领域普通技术人员将认识到本创新的另外的优点。附图说明本专利或申请文件包含以颜色运行的至少一个绘图。具有彩色绘图的本专利或专利申请公开的副本将在要求并支付必要的费用后由专利局提供。附图的目的仅在于图示各个方面,而不应解释为构成限制。图1图示了根据本文中描述的一个或多个方面的、允许用户(例如,临床医师)基于其语义意义来搜索相关临床概念的语义搜索框架或系统。图2是根据本文描述的一个或多个方面的语义分析引擎的图示。图3示出了根据本文中所描述的一个或多个特征的关系发现算法流的范例。图4示出了根据本文中描述的一个或多个特征的NoSQL数据库图解。图5图示了根据本文中所描述的一个或多个特征的、用于从临床文档提取活动诊断的系统。图6示出了根据本文中所描述的一个或多个特征的、从临床文档中提取活动诊断的过程流。图7示出了根据本文所述的一个或多个特征的、例如被显示给临床医师的用于急性冠状动脉综合征的SNOMEDCT树。图8是示出输入文本框的用户界面的屏幕截图,其中,用户可以输入关键词。图9是根据本文中所描述的各个方面的、基于网络的用户界面的屏幕截图,其示出突出显示语义地相关的临床概念的搜索结果。图10是基于网络的用户界面的本体面板的屏幕截图,其示出用户选定的临床概念、颜色编码的图例,以及示出用户选择的概念的本体派生的树。图11是基于网络的用户界面的屏幕截图,其示出了折叠的报告部分和展开的报告部分。图12示出了基于网络的用户界面的屏幕截图,其中,显示了具有突出显示的临床概念的完整临床报告。具体实施方式所描述的系统和方法通过提供与简单关键词匹配相比较在语义意义上相关的搜索结果扩展传统搜索引擎的功能来克服上述问本文档来自技高网
...
用于从临床文档进行语义搜索和提取相关概念的系统和方法

【技术保护点】
一种便于使用用户输入的关键词来基于所述关键词的语义意义搜索相关的临床概念的系统(10),包括:客户网络界面(12),其接收关键词搜索信息(14);语义分析引擎(18),其经由网络服务器(16)接收所述关键词搜索信息并且经由MySQL

【技术特征摘要】
【国外来华专利技术】2015.03.09 US 62/130,1411.一种便于使用用户输入的关键词来基于所述关键词的语义意义搜索相关的临床概念的系统(10),包括:客户网络界面(12),其接收关键词搜索信息(14);语义分析引擎(18),其经由网络服务器(16)接收所述关键词搜索信息并且经由MySQLTM数据库(20)与自然语言处理(NLP)引擎(22)进行通信;其中,所述NLP引擎(22)接收并存储临床注释和信息(24)并且从所述临床注释(24)提取临床概念,并且将所述临床概念存储到NoSQL数据库(26)中;其中,所述语义分析引擎(18)分析所述关键词搜索信息,将关键词映射到至少一个UMLS概念,基于一个或多个关系知识源来识别和检索一个或多个相关的概念;并且其中,所述网络服务器(16)在所述NoSQL数据库(26)中搜索所述相关的概念,并且将相关注释和概念的列表(28)返回到所述网络服务器,以经由所述客户网络界面显示给用户。2.根据权利要求1所述和系统,其中,所述网络服务器还被配置为经由所述客户网络界面将相关注释和概念的所述列表呈现为具有被突出显示以供用户选择的相关概念的临床注释的列表。3.根据权利要求2所述和系统,其中,在接收到与对突出显示的概念的用户选择有关的输入时,所述网络服务器经由所述客户网络界面显示在一个或多个本体内的选定的概念的树结构。4.根据权利要求3所述和系统,其中,所述网络服务器还被配置为经由所述客户网络界面呈现包括所述选定的概念的原始注释。5.根据前述权利要求中的任一项所述的系统,其中,所述列表(28)以对包括所述相关概念的所述注释的创建的时间顺序布置。6.根据前述权利要求中的任一项所述的系统,其中,所述语义分析引擎包括拼写检查器模块(54),所述拼写检查器模块检测并校正关键词信息中的拼写错误,并且将一个或多个关键词映射到一个或多个临床概念(56)。7.根据权利要求6所述的系统,其中,拼写检查器模块通过运行模糊字符串匹配算法来将所述一个或多个关键词映射到所述一个或多个临床概念。8.根据前述权利要求中的任一项所述的系统,还包括关系发现模块(48),所述关系发现模块被配置为识别与所述关键词信息中识别的所述概念有关的概念。9.一种从电子临床文档自动提取活动诊断的方法,包括:接收在患者护理期间生成的自由文本电子文档;识别具有活动诊断的文档部分;识别所识别的部分内的至少一个名词短语(NP)终端;根据每个NP终端生成双联词的集合;使用所述双联词来查询数据库(260);基于级联的字符来识别候选活动诊断;基于句法、语义和层级特征来选择与所述NP终端最相似的候选活动诊断;呈现从所述自由文本文档提取的活动诊断的列表;并且分析与在所述N...

【专利技术属性】
技术研发人员:O·F·法里朱娴淑J·刘
申请(专利权)人:皇家飞利浦有限公司
类型:发明
国别省市:荷兰,NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1