用于生成临床查询的预测系统技术方案

技术编号:25992826 阅读:37 留言:0更新日期:2020-10-20 19:01
本发明专利技术涉及一种用于生成临床查询的预测系统。包括编码在计算机存储介质上的计算机程序的方法、系统和装置用于生成预测系统,该预测系统获得并处理描述不同医学概念的术语的数据,以从用户查询生成命令。系统的实体模块判断术语是否描述与影响个人的健康护理状况相关联的医疗实体。在术语描述医疗实体的情况下,编码模块基于编码方案来将医疗实体与指定类别链接。系统接收用户查询。系统的解析引擎使用接收到的查询,以通过对照描述医疗实体的术语解析查询并基于用于将医疗实体链接至指定类别的编码方案来生成机器可读命令。系统使用该命令在不同的数据库中查询以获得用于生成对所接收到的查询的响应的数据。

【技术实现步骤摘要】
用于生成临床查询的预测系统
本说明书涉及预测计算系统。
技术介绍
作为健康护理过程的一部分,医师或其他医疗护理提供方可以进行临床试验、项目和其它活动,以评价药物或其它医疗治疗选项的受试者安全性和有效性。使用健康相关试验项目可以有助于标识用于改善整体患者健康并降低健康系统成本的新颖治疗选项。临床试验或项目可以是前瞻性地将人类参与者/受试者或人类受试者群体分配至一个或多个健康相关干预以评价对健康结果的影响的一项调查研究或多项调查研究。
技术实现思路
作为健康护理过程的一部分,医师或其他健康护理提供方可以进行试验、项目和其它活动,以评价特定药物或其它医疗治疗选项的有效性。进行健康相关临床试验可以有助于标识用于改善整体患者健康并降低健康系统成本的新颖治疗选项。临床试验和其它受控项目通常由不同地理位置中的医疗设施处的一名或多名调研方进行,这些调研方与研究对象交互以评价药物治疗选项的有效性。在一些情况下,患者的医师可以与临床试验相关联,并且医师可以基于患者的诊断状况将患者转介为参与试验的候选。调研方、地理位置或这两者可以形成用于执行项目的实体。基于以上的上下文,本文描述了一种计算系统,该计算系统使用特定的计算规则或指令(例如,唯一算法)以基于接收到的用户输入来预测或生成命令。为了生成命令,系统被配置为使用一个或多个学习算法(例如,深度学习算法)来训练预测模型。预测模型用于处理使用系统的实体模块中的自然语言处理器(NLP)进行识别和提取的术语。预测模型可被训练为从语义上理解相关术语(例如,医学术语和临床术语)及其与其它医学术语的关系。术语可以从诸如教科书和在线资源等的信息源中提取,或者从诸如多个健康护理患者的电子医疗数据等的非结构化数据集中提取。编码模块使用一个或多个神经网络模型来对所提取的术语进行编码并将其与诸如疾病实体、药物实体、医疗过程(medicalprocedure)实体或各种其它类型的实体等的特定医疗实体相链接。系统利用预测模型关于编码后的医学术语的学习推断,以基于从用户接收到的查询来生成命令。例如,解析引擎可以将所提取的术语自动转化为机器可读命令,该机器可读命令对照医疗数据库进行处理以获得对用户查询的准确响应。因此,预测系统的至少一个目标是以计算高效的方式准确地解释包括与患者或一组患者有关的健康相关信息的用户查询。例如,用户查询代表预测系统的用户输入,该用户输入指定患者属性的列表。查询/用户输入可以是人类可读格式。所描述的技术使得系统能够以计算机可读格式快速且高效地生成相应的命令。然后,使用计算机可读命令来查询不同的电子健康记录(EHR),以基于列表中指定的属性标识满足给定条件的患者(例如,试验受试者)。例如,该命令可以用于查询历史医疗记录,以在没有(例如,来自人类操作者的)人工干预的情况下得到洞察和信息。所得到的洞察可以包括准确的对临床试验参与的合格患者人群的估计和对不良事件的倾向的估计。本说明书中所描述的主题的一个方面可以体现在一种计算机实现的方法中,该方法包括:获得包括多个术语的第一组数据;判断所述多个术语中的术语是否描述医疗实体;响应于判断为所述术语描述所述医疗实体,基于针对类别的编码方案来将所述医疗实体与所述类别相链接;响应于接收到查询,通过对照所述第一组数据中的用于描述所述医疗实体的术语对所述查询进行解析并且基于所述编码方案,来生成机器可读命令;使用所述机器可读命令在多个数据库中进行查询;在使用所述机器可读命令在所述多个数据库中进行查询的情况下,响应于接收到的查询来获得第二组数据;以及提供所述第二组数据作为输出以供在用户装置处显示。这些和其它实现可以各自可选地包括以下特征中的一个或多个。例如,在一些实现中,判断术语是否描述医疗实体包括:基于所述第一组数据中所描述的术语和所述医疗实体之间的相似度的推断来生成置信度得分;以及判断所述置信度得分是否超过阈值置信度得分。在一些实现中,将所述医疗实体与类别相链接包括:获得针对该类别的类别代码的列表;确定术语和类别代码的列表中的相应类别代码之间的匹配;以及基于用于描述所述医疗实体的术语和所述相应类别代码之间的匹配,将所述医疗实体与指定类别相链接。在一些实现中,将所述医疗实体与类别相链接包括:基于针对指定类别的编码方案利用相应类别代码对医疗实体进行编码;以及针对指定类别的编码方案是包括级别层级结构的层级编码方案。在一些实现中,利用相应类别代码对医疗实体进行编码包括:对包括要编码的医疗实体的内容进行量化;确定级别层级结构中的用于映射所述内容的级别的深度;以及将所述内容中所包括的医疗实体与针对级别层级结构中的特定深度级别的相应类别代码相关联。在一些实现中,所述医疗实体是疾病,并且确定所述匹配包括:针对级别层级结构中的各级别生成相应匹配得分;以及判断相应匹配得分是否超过阈值匹配得分。在一些实现中,判断术语是否描述医疗实体包括:对照实体特定数据集中的信息对术语进行查找;以及基于该术语和实体特定数据集中的第一条目之间的匹配,判断为该术语描述所述医疗实体。在一些实现中,所述医疗实体与影响个人的健康护理状况相关联,以及所述医疗实体包括以下项至少之一:一个或多个医学疾病;用于治疗所述一个或多个医学疾病的医疗药物;与所述一个或多个医学疾病相关联的医疗过程;以及用于描述与个人的健康护理状况相对应的多个医学发现的数据。在一些实现中,实体特定数据集是基于包括以下各项中至少之一的数据而生成的:i)用于描述多个疾病的一组预定义信息;(ii)用于描述多个药物的一组预定义信息;(iii)用于描述多个医疗过程的一组预定义信息;以及iv)多个医学患者的电子医疗数据。在一些实现中,获得用于描述与多个医学概念相关的术语的数据包括:获得多个非结构化数据;以及构造非结构化数据,使得能够对照多个数据库中的信息来处理所述查询。该方面和其它方面的其它实现包括相应的系统、装置和计算机程序,其被配置为进行在计算机存储装置上编码的方法的动作。一个或多个计算机或硬件电路的计算系统可以通过安装在系统上的软件、固件、硬件或它们的组合来配置,这些软件、固件、硬件或它们的组合在操作时使系统执行动作。一个或多个计算机程序可以通过具有如下指令来配置,这些指令在由数据处理装置执行时使装置执行动作。可以实施本说明书中所描述的主题以实现以下优点中的一个或多个。所描述的技术提供了可扩展计算系统,该可扩展计算系统是用于分析和解析结构化和非结构化数据集的全自动端到端预测解决方案。使用分析和解析功能,系统的预测模型被配置为使得可以使用基于预测模型所学到的数据推断而生成的机器可读命令来查询数据集中的信息。预测系统被配置为快速且高效地分析用于描述各种疾病和适应症、药物/治疗选项、以及医疗过程的多个数据集。例如,通过使用如下的三个步骤生成命令来证明系统的效率:(1)提取用于描述患者属性的实体;(2)将状况映射到标准化科学实体名称;(3)以及解释不同健康护理状况之间的关系,包括状况是否被否定。因此,系统提供了专门用于对医学语言术语进行识别本文档来自技高网...

【技术保护点】
1.一种计算机实现的方法,其使用预测计算系统来进行,所述方法包括:/n获得包括多个术语的第一组数据;/n判断所述多个术语中的术语是否描述医疗实体;/n响应于判断为所述术语描述所述医疗实体,基于针对类别的编码方案来将所述医疗实体与所述类别相链接;/n响应于接收到查询,通过对照所述第一组数据中的用于描述所述医疗实体的术语对所述查询进行解析并且基于所述编码方案,来生成机器可读命令;/n使用所述机器可读命令在多个数据库中进行查询;/n在使用所述机器可读命令在所述多个数据库中进行查询的情况下,响应于接收到的查询来获得第二组数据;以及/n提供所述第二组数据作为输出以供在用户装置处显示。/n

【技术特征摘要】
20190404 US 16/375,4031.一种计算机实现的方法,其使用预测计算系统来进行,所述方法包括:
获得包括多个术语的第一组数据;
判断所述多个术语中的术语是否描述医疗实体;
响应于判断为所述术语描述所述医疗实体,基于针对类别的编码方案来将所述医疗实体与所述类别相链接;
响应于接收到查询,通过对照所述第一组数据中的用于描述所述医疗实体的术语对所述查询进行解析并且基于所述编码方案,来生成机器可读命令;
使用所述机器可读命令在多个数据库中进行查询;
在使用所述机器可读命令在所述多个数据库中进行查询的情况下,响应于接收到的查询来获得第二组数据;以及
提供所述第二组数据作为输出以供在用户装置处显示。


2.根据权利要求1所述的方法,其中,判断术语是否描述医疗实体包括:
基于在所述第一组数据中所描述的术语和所述医疗实体之间的相似度的推断,来生成置信度得分;以及
判断所述置信度得分是否超过阈值置信度得分。


3.根据权利要求1所述的方法,其中,将所述医疗实体与所述类别相链接包括:
获得针对所述类别的类别代码的列表;
确定所述术语和类别代码的列表中的相应类别代码之间的匹配;以及
基于用于描述所述医疗实体的术语和所述相应类别代码之间的匹配,将所述医疗实体与指定类别相链接。


4.根据权利要求1所述的方法,其中,将所述医疗实体与所述类别相链接包括:
基于针对指定类别的编码方案来利用相应类别代码对所述医疗实体进行编码,
其中,针对所述指定类别的编码方案是包括级别层级结构的层级编码方案。


5.根据权利要求4所述的方法,其中,利用相应类别代码对所述医疗实体进行编码包括:
对包括要编码的医疗实体的内容进行量化;
确定所述级别层级结构中的用于映射所述内容的级别的深度;以及
将所述内容中所包括的医疗实体与针对所述级别层级结构中的特定深度级别的相应类别代码相关联。


6.根据权利要求3所述的方法,其中,所述医疗实体是疾病,以及确定所述匹配包括:
针对级别层级结构中的各级别生成相应匹配得分;以及
判断所述相应匹配得分是否超过阈值匹配得分。


7.根据权利要求1所述的方法,其中,判断术语是否描述医疗实体包括:
对照实体特定数据集中的信息来进行所述术语的查找;以及
基于所述术语和所述实体特定数据集中的第一条目之间的匹配,判断为所述术语描述所述医疗实体。


8.根据权利要求7所述的方法,其中,所述医疗实体与影响个人的健康护理状况相关联,以及其中所述医疗实体包括以下项中至少之一:
一个或多个医学疾病;
用于治疗所述一个或多个医学疾病的医疗药物;
与所述一个或多个医学疾病相关联的医疗过程;以及
用于描述与个人的健康护理状况相对应的多个医学发现的数据。


9.根据权利要求7所述的方法,其中,所述实体特定数据集是基于包括以下项中至少之一的数据而生成的:
i)用于描述多个疾病的预定义的一组信息;
ii)用于描述多个药物的预定义的一组信息;
iii)用于描述多个医疗过程的预定义的一组信息;以及
iv)多个健康护理患者的电子医疗数据。


10.根据权利要求1所述的方法,其中,获得用于描述与多个医学概念有关的术语的数据包括:
获得多个非结构化数据;以及
构造所述非结构化数据,使得能够对照所述多个数据库中的信息来处理所述查询。


11.一种系统,包括:
一个或多个处理装置;以及
一个或多个非暂时性机器可读存储装置,其存储指令,所述指令能够由所述一个或多个处理装置执行以使得进行操作,所述操作包括:
获得包括...

【专利技术属性】
技术研发人员:N·杜舍夫K·摩根J·P·阿尔伯纳L·格拉斯S·萨克拉尼
申请(专利权)人:IQVIA有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1