使用自然语言处理的对疾病和病症的基于深度学习的诊断和转诊制造技术

技术编号:28990997 阅读:9 留言:0更新日期:2021-06-23 09:44
本文公开了用于执行对疾病和病症的医疗诊断的基于人工智能(AI)的方法的方法和系统。自动化自然语言处理(NLP)系统执行深度学习技术以从电子健康记录(EHR)提取临床相关信息。这个框架提供了高诊断准确度,其展示用于全身性疾病诊断和管理的成功的基于AI的方法。

【技术实现步骤摘要】
【国外来华专利技术】使用自然语言处理的对疾病和病症的基于深度学习的诊断和转诊交叉引用本申请要求2018年6月29日提交的第62/692,572号美国临时申请、2018年10月23日提交的第62/749,612号美国临时申请和2018年12月21日提交的第62/783,962号美国临时申请的利益,其中每个申请通过引用被全部并入本文。本公开的背景医疗信息随着时间的推移变得越来越复杂。疾病实体、诊断测试和生物标志物以及治疗方法的范围近年来呈指数级增加。随后,临床决策也变得更复杂,且需要综合大量数据点。本公开的概述在当前的数字时代中,电子健康记录(EHR)表示电子数据点的大规模存储库,该电子数据点表示各种各样的临床信息。本文公开了人工智能(AI)方法,其提供了挖掘和利用EHR数据以用于疾病诊断和管理的强大工具,其可以模拟和/或增强人类医生的临床决策。为了为任何特定的患者制定诊断,医生经常使用假设演绎推理。以主诉开始,医生然后适当地询问与该主诉相关的有针对性的问题。从这个初始的小特征集起,医生形成鉴别诊断,并决定接下来获得什么特征(历史问题、体检发现、实验室测试和/或影像学检查)以决定或排除鉴别诊断集中的诊断。最有帮助的特征被识别,使得当诊断之一的概率达到预定可接受性水平时,过程停止,并且诊断被接受。也许可能仅用几个特征达到诊断的可接受的确定性水平而不必处理整个特征集。因此,医生可以被认为是种分类器。本文描述了一种基于AI的系统,其使用机器学习来从EHR笔记提取临床相关特征以模仿人类医生的临床推理。在医学中,机器学习方法通常被限制到基于影像学的诊断,但是EHR数据的分析提出了许多艰难的挑战。这些挑战包括海量数据、非结构化文本的使用、语言处理的复杂性、高维度、数据稀疏性、不规则性(噪声)的程度以及在医疗数据中的偏差或系统性错误。此外,相同的临床表型可以被表达为多个不同的代码和术语。这些挑战使得使用机器学习方法来执行准确的模式识别和生成预测性临床模型变得困难。常规方法通常需要专家知识并且是劳动密集型的,这使规模化和一般化变得困难,或者是稀疏的、嘈杂的和重复的。本文描述的机器学习方法可以克服这些限制。本文描述了利用用于EHR数据的数据挖掘框架的系统和方法,该数据挖掘框架整合先前的医疗知识和数据驱动的建模。在一些实施例中,开发并利用基于深度学习的自动化语言处理系统来提取临床相关信息。在一些实施例中,基于所提取的临床特征来建立诊断系统。在一些实施例中,该框架被应用于疾病(例如儿科疾病)的诊断。这种方法在大的儿科群体中被测试,以研究基于AI的方法跨越大量患者记录以及此外跨越各种条件的使自然语言处理方法自动化的能力。本公开解决了基于EHR使对疾病的分析和诊断自动化的各种技术问题。本文描述的系统和方法通过使用信息模型提取语义数据、使用基于深度学习的语言处理而识别临床相关特征以及利用特征以成功地将疾病分类或诊断疾病来解决本文讨论的技术挑战。对使用本文所述的电子健康记录来有效地实现基于计算机的算法疾病诊断的技术问题的技术解决方案开辟了机器学习技术的先前未实现的潜力以彻底改革基于EHR的分析和诊断。本文公开了一种用于提供医疗诊断的方法,该方法包括:获得医疗数据;使用自然语言处理(NLP)信息提取模型来从医疗数据提取和注释临床特征;以及用疾病预测分类器分析临床特征中的至少一个以生成疾病或病症的分类,该分类具有至少80%的灵敏度。在一些实施例中,NLP信息提取模型包括深度学习程序。在一些实施例中,NLP信息提取模型利用包括表示断言类(assertionclass)的关键词的标准词典。在一些实施例中,NLP信息提取模型利用多个模式(schema),每个模式包括特征名称、解剖位置和值。在一些实施例中,多个模式包括以下中的至少一项:现病史、身体检查、实验室测试、放射学报告和主诉。在一些实施例中,该方法包括将医疗数据标记化以供NLP信息提取模型处理。在一些实施例中,医疗数据包括电子健康记录(EHR)。在一些实施例中,该分类具有至少80%的特异性。在一些实施例中,该分类具有至少80%的F1分数。在一些实施例中,以结构化格式提取临床特征,该结构化格式包括采用查询-回答对的数据。在一些实施例中,疾病预测分类器包括逻辑回归分类器。在一些实施例中,疾病预测分类器包括决策树。在一些实施例中,该分类在严重状况和非严重状况之间进行区分。在一些实施例中,该分类包括至少两个类目级别。在一些实施例中,该分类包括指示器官系统的第一级类目。在一些实施例中,该分类包括指示器官系统的子类目的第二级。在一些实施例中,该分类包括将疾病或病症按类目分成一系列较窄类目的诊断层级。在一些实施例中,该分类包括选自由以下项组成的组的类目:呼吸道疾病、泌尿生殖疾病、胃肠疾病、神经精神疾病和全身性疾病。在一些实施例中,该分类还包括将呼吸道疾病细分为上呼吸道疾病和下呼吸道疾病。在一些实施例中,该分类还包括将上呼吸道疾病细分为急性上呼吸道疾病、鼻窦炎或急性喉炎。在一些实施例中,该分类还包括将下呼吸道疾病细分为支气管炎、肺炎、哮喘或急性气管炎。在一些实施例中,该分类还包括将胃肠疾病细分为腹泻、口腔相关疾病或急性咽炎。在一些实施例中,该分类还包括将神经精神疾病细分为抽动障碍、注意力缺乏多动症、细菌性脑膜炎、脑炎或惊厥。在一些实施例中,该分类还包括将全身性疾病细分为手足口病、无并发症的水痘、流感、传染性单核细胞增多症、脓毒症或幼儿急疹。在一些实施例中,该方法还包括基于该分类来做出医学治疗建议。本文公开了包括机器可执行代码的非暂时性计算机可读介质,机器可执行代码在由一个或更多个计算机处理器执行时实现用于提供对疾病或病症的分类的方法,该方法包括:获得医疗数据;使用自然语言处理(NLP)信息提取模型来从医疗数据提取和注释临床特征;以及用疾病预测分类器分析临床特征中的至少一个以生成疾病或病症的分类,该分类具有至少80%的灵敏度。在一些实施例中,NLP信息提取模型包括深度学习程序。在一些实施例中,NLP信息提取模型利用包括表示断言类的关键词的标准词典。在一些实施例中,NLP信息提取模型利用多个模式,每个模式包括特征名称、解剖位置和值。在一些实施例中,多个模式包括以下中的至少一项:现病史、身体检查、实验室测试、放射学报告和主诉。在一些实施例中,该方法包括将医疗数据标记化以供NLP信息提取模型处理。在一些实施例中,医疗数据包括电子健康记录(EHR)。在一些实施例中,该分类具有至少80%的特异性。在一些实施例中,该分类具有至少80%的F1分数。在一些实施例中,以结构化格式提取临床特征,该结构化格式包括采用查询-回答对的数据。在一些实施例中,疾病预测分类器包括逻辑回归分类器。在一些实施例中,疾病预测分类器包括决策树。在一些实施例中,该分类在严重状况和非严重状况之间进行区分。在一些实施例中,该分类包括至少两个类目级别。在一些实施例中,该分类包括指示器官系统的第一级类目。在一些实施例中,该分类包括指示器官系统的子类目的第二级。在一些实施例中,该分类包括将疾病或病症按类目分成一系列较窄类目的诊断层级。在一些实施例中,该本文档来自技高网...

【技术保护点】
1.一种用于提供医疗诊断的方法,包括:/na)获得医疗数据;/nb)使用自然语言处理(NLP)信息提取模型以从所述医疗数据提取和注释临床特征;以及/nc)用疾病预测分类器分析所述临床特征中的至少一种以生成疾病或病症的分类,所述分类具有至少80%的灵敏度。/n

【技术特征摘要】
【国外来华专利技术】20180629 US 62/692,572;20181023 US 62/749,612;20181.一种用于提供医疗诊断的方法,包括:
a)获得医疗数据;
b)使用自然语言处理(NLP)信息提取模型以从所述医疗数据提取和注释临床特征;以及
c)用疾病预测分类器分析所述临床特征中的至少一种以生成疾病或病症的分类,所述分类具有至少80%的灵敏度。


2.根据权利要求1所述的方法,其中,所述NLP信息提取模型包括深度学习程序。


3.根据权利要求1所述的方法,其中,所述NLP信息提取模型利用包括表示断言类的关键词的标准词典。


4.根据权利要求1所述的方法,其中,所述NLP信息提取模型利用多个模式,每个模式包括特征名称、解剖位置和值。


5.根据权利要求4所述的方法,其中,所述多个模式包括以下中的至少一项:现病史、身体检查、实验室测试、放射学报告和主诉。


6.根据权利要求1所述的方法,还包括将所述医疗数据标记化以供所述NLP信息提取模型处理。


7.根据权利要求1所述的方法,其中,所述医疗数据包括电子健康记录(EHR)。


8.根据权利要求1所述的方法,其中,所述分类具有至少80%的特异性。


9.根据权利要求1所述的方法,其中,所述分类具有至少80%的F1分数。


10.根据权利要求1所述的方法,其中,所述临床特征是以结构化格式提取的,所述结构化格式包括采用查询-回答对的数据。


11.根据权利要求1所述的方法,其中,所述疾病预测分类器包括逻辑回归分类器。


12.根据权利要求1所述的方法,其中,所述疾病预测分类器包括决策树。


13.根据权利要求1所述的方法,其中,所述分类在严重状况和非严重状况之间进行区分。


14.根据权利要求1所述的方法,其中,所述分类包括至少两个类目级别。


15.根据权利要求1所述的方法,其中,所述分类包括指示器官系统的第一级类目。


16.根据权利要求15所述的方法,其中,所述分类包括指示所述器官系统的子类目的第二级。


17.根据权利要求1所述的方法,其中,所述分类包括将所述疾病或病症按类目分成一系列较窄类目的诊断层级。


18.根据权利要求17所述的方法,其中,所述分类包括选自由以下项组成的组的类目:呼吸道疾病、泌尿生殖疾病、胃肠疾病、神经精神疾病和全身性疾病。


19.根据权利要求18所述的方法,其中,所述分类还包...

【专利技术属性】
技术研发人员:张康李志焕郑良宏
申请(专利权)人:人工智能技术公司加利福尼亚大学董事会
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1