以患者为中心的临床知识发现系统技术方案

技术编号:21208081 阅读:32 留言:0更新日期:2019-05-25 03:48
一种医学信息检索系统包括自然语言处理系统,所述自然语言处理系统处理语音用户查询以识别关键词和短语。这些关键词和短语被提供给推理引擎,所述推理引擎基于这些关键词和短语来提供来自医学知识源的基于知识的推论的集合。其后,这些基于知识的推论被提供给信息检索引擎,所述信息检索引擎基于这些基于知识的推论来检索对应的多篇医学文章,并且关于所述基于知识的推论对每篇医学文章进行排名。总结引擎接收经排名的文章并基于在排名高的文章中找到的主题关键词和候选句子来创建模型。释义引擎处理所述候选句子以根据基于知识的释义模型来提供总结响应。音频输出设备将总结报告呈现为对所述用户的原始语音查询的响应。

Patient-centered clinical knowledge discovery system

A medical information retrieval system includes a natural language processing system that processes voice user queries to identify keywords and phrases. These keywords and phrases are provided to the reasoning engine, which provides a set of knowledge-based inferences from medical knowledge sources based on these keywords and phrases. Subsequently, these knowledge-based inferences are provided to the information retrieval engine, which retrieves the corresponding medical articles based on these knowledge-based inferences, and ranks each medical article with respect to the knowledge-based inferences. The summary engine receives ranked articles and creates models based on keywords and candidate sentences found in high-ranked articles. The interpretation engine processes the candidate sentences to provide a summary response based on a knowledge-based interpretation model. The audio output device presents the summary report as a response to the user's original voice query.

【技术实现步骤摘要】
【国外来华专利技术】以患者为中心的临床知识发现系统
本专利技术涉及促进对患者病历中包含的信息的有效且高效检索和合并的计算机增强领域,并且具体地涉及使用深度学习、自然语言处理和语音服务的组合来处理用户关于患者病历中包含的信息的查询的基于知识的发现系统。
技术介绍
计算机系统上可用的常规处理不太适合对非临床专家关于针对临床专家设计和实施的记录中包含的信息的查询(例如,来自患者的关于患者病历中包含的信息的“含义”或“影响”的查询)做出响应。通常,患者可以拜访执业医生以接收给定的测试或一系列测试的结果。该测试结果可能具有高度技术性,并且执业医生将该技术数据(血红蛋白计数、脂质计数、收缩压等)“翻译”为患者可能理解的术语。在拜访执业医生时,患者可以问问题并且可以在至少基本了解他/她的病情的情况下离开。然而,在许多情况下,患者可能随后会意识到他/她并没有完全了解他/她的病情并且想到他/她应该向执业医生问的问题或者想到要向另一专业人员问的可能有助于验证或否定执业医生的诊断的问题。通过使用常规的计算机搜索技术,患者可以使用搜索引擎来搜索执业医生使用的特定术语或者前往参考站点(例如,维基百科)以接收对特定术语或病情的解释。然而,这样的搜索或参考的结果通常将是“参差不齐的”并且提供不太令人满意的解释,因为这些结果将基于患者对要搜索的特定术语的描述并且这些结果可能是患者并不能真正理解的语言(医学专业术语)。实质上,由于患者对医学专业中使用的高度技术性术语和短语的非专业理解,因此患者通常受限于他/她明确地表达反映患者的关注同时充分实施对该领域的专业人员公布的材料的有效且高效的搜索的查询的能力。类似地,即使患者的查询充分定位该领域中适用的参考文献,但是对所定位的参考材料的仅有呈现可能对患者而言实际上难以理解,或者,所定位的参考材料的量对于患者来说可能过多以至于无法在任何合理的时间量内消化吸收。鉴于让患者和消费者获取足够的证据和相关信息以促进明智的健康相关的决策制定的当前驱动力,需要增强现有的计算机搜索和报告工具来处理大量计算机可获得的健康信息并将其传递给常常寻求对他/她的医学困惑的答案的“好奇和/或焦虑的”患者。除了通过聚集和总结现有的大量生物医学文献中的大量事实和发现来向非临床专家提供有意义的信息之外,还需要解决患者和消费者在定制他们的搜索中通过使用适当的技术语言来提供对通常记录在文献中的证据的有效检索而遇到的困难的事实。增强计算机联网系统的能力以向患者和消费者提供支持从而实现对有效且高效的查询的构建并提供适当的答案能够朝向对预防性和治疗性介入的遵从性、健康意识和素养、生活方式改变以及健康生活显著改善患者参与。
技术实现思路
提供显著改进计算机系统在医学信息检索和报告领域的能力的系统和方法将是有利的。在该框架内,通过促进基于用户的非专业查询的有效且高效的搜索来显著改善系统能力将是有利的。同样在该框架内,通过促进针对非专业用户对检索到的信息的有效且高效的聚集和总结来显著改善系统的能力将是有利的。为了更好地解决这些关注中的一个或多个,在本专利技术的一个实施例中,提供了一种临床知识发现系统,其结合了自然语言处理(NLP)与深度学习算法,以检索并总结来自生物医学出版物的发现,作为对来自患者和其他非专业用户的查询的答案。可以提供音频输入和输出以及文本输入和输出。在示例性实施例中,所述医学信息检索系统包括接收用户查询的输入设备以及处理所述用户查询以识别关键词和短语的自然语言处理系统。然而,与常规的搜索技术相比,并不是将这些关键词和短语直接提交给信息检索(搜索)引擎。相反,将这些关键词和短语提供给推理引擎,所述推理引擎基于这些关键词和短语来提供来自医学知识源的基于知识的推论的集合。其后,将这些基于知识的推论提供给信息检索引擎,所述信息检索引擎基于这些基于知识的推论来检索对应的多个搜索结果,并且关于所述基于知识的推论对每个搜索结果进行排名。总结引擎接收多个经排名的搜索结果,基于所述多个搜索结果来识别主题关键词和候选句子,基于所述主题关键词和所述候选句子来创建模型,并且基于所述模型来提供总结报告。输出设备将所述总结报告呈现为对所述用户的原始查询的响应。附图说明参考附图,通过举例的方式进一步详细解释了本专利技术,其中:图1图示了包括自然语言处理器、推理引擎、搜索引擎以及总结引擎的医学信息检索系统的示例性框图。图2图示了用于基于知识源来创建推理引擎的示例性框图。图3图示了由医学信息检索系统提供的示例性用户查询和响应。图4图示了总结引擎的示例性框图。图5图示了释义引擎的示例性框图。在整个附图中,相同的附图标记指示相似或对应的特征或功能。附图出于说明性目的而被包括,并且不旨在限制本专利技术的范围。具体实施方式在以下描述中,出于解释而非限制的目的,阐述了诸如特定架构、接口、技术等具体细节,以便提供对本专利技术的构思的透彻理解。然而,对于本领域技术人员而言将明显的是,本专利技术可以在脱离这些具体细节的其他实施例中进行实践。以类似的方式,本说明书的文本涉及如附图中所示的示例性实施例,并且不旨在将要求保护的本专利技术限制在权利要求中明确包括的限制之外。出于简单和清楚的目的,省略了对公知的设备、电路和方法的详细描述,以免不必要的细节模糊本专利技术的描述。图1图示了根据本专利技术的原理的医学信息检索系统的实施例的示例性框图。在该示例性实施例中,该系统接收以口头陈述和/或问题的形式的查询。语音到文本转换器110使用例如常规的语音识别系统将说出的词语和短语转换成文本。自然语言处理(NLP)引擎120分析来自语音识别系统的文本以识别关键词或短语125。NLP引擎120可以是语音识别系统的部件,并且可以被专门设计用于将要使用它的特定背景(例如,医学背景)以识别在该背景内具有特定含义的术语。在示例性实施例中,NLP引擎120可以包括用于句子边界检测的通用的基于规则的算法;用于词性标注的语言模型;以及在特定语言语料库上训练的机器学习分类器,以识别名词性短语、形容词性短语、动词性短语等。可以使用字典驱动或本体驱动的处理将短语映射到识别的关键词,并且使用文档和/或应用的背景元素来消除提取的词语的意义的歧义。专利技术人已经认识到,基于从用户的查询中提取的关键词进行搜索的缺陷在于,搜索术语实质上受用户的词汇的限制。针对该缺陷的常规解决方案包括例如基于本体的处理,其找到与用户提供的术语同义的备选术语。然而,如果用户未使用与特定术语同义的术语,则该术语将不会被包括在搜索查询中。在图1的示例性实施例中,检索系统内的推理引擎130用于基于由NLP引擎120导出的关键词和短语125来生成“推论”135。可以使用无监督的机器学习处理来创建推理引擎130,无监督的机器学习处理使用如图2所示的一个或多个域特异性知识源140来训练。在图2中,知识源140(例如,医学文本的集合)由提取器210解析。提取器210被配置为提取词语级、短语级和文档级术语,这些术语都被提供给耦合到推理引擎130的训练器220。推理引擎130可以例如是神经网络模型。使用常规的无监督的学习技术,可以训练推理引擎130以识别包含在知识源140中的医学术语和短语之间的关系。例如,使用来自知识源140的大量句子的词语级、短语级和文档级向量表示,可以根据这些向量表示的聚集贡献(“神经嵌本文档来自技高网
...

【技术保护点】
1.一种医学信息检索系统,包括:输入设备,其接收用户查询;自然语言处理系统,其处理所述用户查询以识别关键词和短语;推理引擎,其接收所述关键词和所述短语并基于所述关键词和所述短语来提供来自医学知识源的多个基于知识的推论;信息检索引擎,其接收所述多个基于知识的推论并搜索多个生物医学参考源以基于所述多个基于知识的推论来识别多篇医学文章,并且关于所述基于知识的推论对每篇文章进行排名;总结引擎,其接收多篇经排名的文章,基于所述经排名的文章来识别主题关键词和候选句子,并且基于所述主题关键词和所述候选句子来提供总结报告;以及输出设备,其响应于所述用户查询而呈现所述总结报告。

【技术特征摘要】
【国外来华专利技术】2016.10.11 US 62/4064271.一种医学信息检索系统,包括:输入设备,其接收用户查询;自然语言处理系统,其处理所述用户查询以识别关键词和短语;推理引擎,其接收所述关键词和所述短语并基于所述关键词和所述短语来提供来自医学知识源的多个基于知识的推论;信息检索引擎,其接收所述多个基于知识的推论并搜索多个生物医学参考源以基于所述多个基于知识的推论来识别多篇医学文章,并且关于所述基于知识的推论对每篇文章进行排名;总结引擎,其接收多篇经排名的文章,基于所述经排名的文章来识别主题关键词和候选句子,并且基于所述主题关键词和所述候选句子来提供总结报告;以及输出设备,其响应于所述用户查询而呈现所述总结报告。2.根据权利要求1所述的系统,其中,所述输入设备包括音频输入设备,并且所述输出设备包括音频输出设备。3.根据权利要求1所述的系统,其中,所述推理引擎包括使用所述医学知识源训练的神经模型,并且在接收到所述关键词和所述短语后提供所述基于知识的推论。4.根据权利要求1所述的系统,其中,所述医学知识源包括一个或多个医学文本。5.根据权利要求1所述的系统,其中,所述多个生物医学参考源经由互联网连接来访问。6.根据权利要求1所述的系统,其中,所述总结引擎基于所述主题关键词和所述候选句子来创建模型,并且使用所述模型来创建所述总结报告。7.根据权利要求1所述的系统,其中,所述总结引擎包括受限玻尔兹曼机。8.根据权利要求1所述的系统,还包括释义引擎,所述释义引擎将基于所述候选句子的释义的句子提供给所述总结报告。9.根据权利要求8所述的系统,其中,所...

【专利技术属性】
技术研发人员:O·F·法里S·S·阿尔哈桑柳俊毅K·M·Y·李V·V·达特拉
申请(专利权)人:皇家飞利浦有限公司
类型:发明
国别省市:荷兰,NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1