在实体之间学习和应用背景相似性制造技术

技术编号:23293687 阅读:21 留言:0更新日期:2020-02-08 22:44
本文公开的技术涉及学习和应用背景患者相似性。可以提供(602)多个模板相似性函数(118)。每个模板相似性函数可以将查询实体特征向量的相应的特征子集与候选实体特征向量的对应的特征子集进行比较。可以提供(604)复合相似性函数(120)作为所述模板相似性函数的相应输出的加权组合。可以提供(606)多个标记的实体向量作为背景训练数据。可以应用(608)逼近函数以针对每个相应标记的实体向量来逼近第一背景标记。可以通过以下操作,基于所述复合相似性函数来训练(610)第一背景特异性复合相似性函数:基于所述逼近函数针对所述第一背景训练数据的所述应用的输出,使用第一损失函数来学习针对所述多个模板相似性函数的第一背景权重。

Learning and application background similarity between entities

【技术实现步骤摘要】
【国外来华专利技术】在实体之间学习和应用背景相似性相关申请的交叉引用本申请要求于2017年4月20日提交的美国临时申请US62/487720的优先权和权益,通过引用将其全部内容并入本文。
本文描述的各种实施例总体上针对实体数据分析。更具体地,但非排他性地,本文公开的各种方法和装置涉及用于学习和应用实体背景相似性的技术。
技术介绍
已经开发了各种临床决策支持(“CDS”)算法来提供针对近期和/或长期患者恶化的风险评分。这些技术有助于更好地识别高危患者并给出恰当规划介入过程的临床时间。有时,这种治疗决策步骤由临床指南来确定。然而,指南不是个性化的且无法考虑所有可能的情况。相反,常常需要临床医生来做出决策并且他/她必须依赖于过去的经验。
技术实现思路
本公开内容针对用于学习和应用实体背景相似性的技术。例如,在各种实施例中,本文所述的技术可以由正在处置特定患者实体的临床医生(例如,医师、护士)、护理人员等使用以识别相似的其他患者,特别是在特定医学背景中相似的其他患者。通过识别其他背景相似的患者,临床医生能够了解哪种处置是有效的或无效的,哪种处置倾向于产生特定的结果等。本文描述了各种现场即时治疗决策支持工具(例如,由(一个或多个)处理器运行的软件),这些工具为临床医生提供了关于正在接受处置的患者(在本文中也被称为“查询患者”)的各种信息,包括与各种医学背景中的查询患者相似的其他患者(例如,共特征群体)。在各种实施例中,可以采用诸如人工智能(例如,深度学习、机器学习、内核分类、多内核学习等)和/或统计技术的技术来促进对背景相似患者的识别。例如,在一些实施例中,可以生成多个(或“池”)“模板相似性函数”。模板相似性函数池中的每个模板相似性函数可以将与查询患者相关联的特征向量的某个子集和与一个或多个其他患者(在本文中将被称为“候选患者”)相关联的(一个或多个)特征向量的对应子集进行比较。诸如患者之类的实体可以具有随时间变化的状态。因此,诸如查询患者特征向量之类的实体特征向量可以被视为在特定时刻或时间窗口期间实体状态的“快照”。例如,随着时间的流逝并且随着患者经历更多的检验、处置、测量等,患者的特征向量也可以类似地随时间变化。在一些实施例中,可以设计或“调谐”每个模板相似性函数以确定两个患者在与患者相关联的特征向量的给定特征子集方面有多相似。因此,每个模板相似性函数的形状可以由与正被比较的特征子集相关联的群体统计量(例如,分布)来指导。这些群体统计量可以例如从回顾性患者数据库中导出。在一些实施例中,可以调谐模板相似性函数中的一个或多个,以突出显示或放大具有共同异常值的患者之间的相似性,该异常值例如为落到特定特征的分布的“尾部”的离群值。总体而言,模板相似性函数池可以提供两个患者之间的多样化的相似性观点。在一些实施例中,可以将来自模板相似性函数池的输出提供为针对在本文中被称为“复合相似性函数”的输入(例如在其上进行应用)。在一些实施例中,复合相似性函数可以基于模板相似性函数池的输出来计算查询患者与候选患者的“复合相似性得分”。在各种实施例中,复合相似性函数可以采取机器学习模型、深度学习模型、统计模型等的形式。在一些实施例中,复合相似性函数可以计算模板相似性函数池的输出的凸组合。在一些实施例中,复合相似性函数可以采取多个模板相似性函数的相应输出的加权组合的形式。不同的权重集合可以在不同的背景中应用于模板相似性函数的输出。例如,第一权重集合可以在血液动力学不稳定的背景中应用,第二权重集合可以在急性肾脏损伤的背景中应用,诸如此类。可以调谐在特定医学背景中应用的权重,以放大对该背景相对重要的个体模板相似性函数的输出。在医学背景中的其他不那么重要的输出的加权可以相对较小。可以通过各种方式来学习权重。在一些实施例中,可以使用一种或多种内核学习技术(例如,内核平滑算法)来学习权重。可以基于针对特定医学背景标记的训练数据来学习这些权重(或者换句话说,训练复合相似性函数的背景特异性版本)。例如,为了学习针对血液动力学不稳定的背景的权重,可以应用利用血液动力学不稳定的某种度量来标记的训练数据。为了学习针对急性肾脏损伤的背景的权重,可以应用利用急性肾脏损伤的某种度量标记的训练数据,诸如此类。一旦学习了针对各种医学背景的权重,就可以将模板相似性函数池和复合相似性函数应用于查询患者和一个或多个候选患者的特征向量,以在各种背景中识别相似的候选患者。例如,可以确定和提供在血液动力学不稳定的背景中与查询患者最相似的候选患者的排名列表。在一些实施例中,该排名列表可以例如用于识别背景相似患者的“共特征群体”。然后,临床医生能够评价应用于类似患者的共特征群体的处置以及由此产生的结果,以便更智能地选择针对查询患者的处置。额外地或替代地,在一些实施例中,可以使用模板相似性函数池和复合相似性函数,例如通过选择与感兴趣背景相关联的权重来预测在特定背景中的查询患者的临床状态。虽然本文描述的示例涉及医疗保健,但是这并不意味着限制。本文描述的技术可以应用于医疗保健之外的多种领域。例如,本文描述的技术可以用于识别与需要从药物滥用和/或酒精滥用康复的个体背景相似实体,例如使得能够学习并利用背景相似的个体的结果来选择康复计划。本文描述的技术还可以用于其他领域,例如,旅行(例如识别具有相似品味的其他人以选择最可能令人开心的行程)、运动(例如比较运动员以进行团队选择)等。另外,本文描述的技术产生了多种技术优势。例如,通过调谐如本文所述的模板相似性函数,可以避免对缺失数据的填补方法,因为如果存在值,则模板相似性函数可能仅贡献于复合相似性函数的输出。消除对数据填补的需求可以减小不准确性和/或节省诸如处理器周期、存储器等的计算资源。此外,采用复合相似性函数(特别是针对不同背景学习的不同权重)可以有效地施加稀疏的正则化器(例如,“L1-范数”),其允许忽略对性能提高没有帮助的模板相似性。在医疗保健领域,准确识别背景相似性的共特征群体,特别是能够评价共特征群体的处置和/或结果,可以促进更智能和/或更有效的临床决策。通常,在一个方面中,一种方法可以包括以下操作:提供多个模板相似性函数,其中,所述多个模板相似性函数中的每个模板相似性函数将查询实体特征向量的相应的特征子集与候选实体特征向量的对应的特征子集进行比较;提供复合相似性函数作为所述多个模板相似性函数的相应输出的加权组合;提供第一多个标记的实体向量作为第一背景训练数据;应用逼近函数,以针对所述第一背景训练数据的每个相应标记的实体向量,基于所述复合相似性函数的输出和所述第一背景训练数据的其他的标记的实体向量的相应第一背景标记来逼近针对相应标记的实体向量数据的第一背景标记;并且基于所述复合相似性函数来训练第一背景特异性复合相似性函数,其中,训练所述第一背景特异性复合相似性函数包括基于所述逼近函数针对所述第一背景训练数据的所述应用的输出,使用第一损失函数来学习针对所述多个模板相似性函数的第一背景权重,其中,所述第一权重被存储以供用作所述第一背景特异性复合相似性函数的部分。在各种实施例中,所述方法还可本文档来自技高网...

【技术保护点】
1.一种训练用于确定相似性的背景特异性模型的方法,所述方法包括:/n提供(602)多个模板相似性函数(118),其中,所述多个模板相似性函数中的每个模板相似性函数将查询实体特征向量的相应的特征子集与候选实体特征向量的对应的特征子集进行比较;/n提供(604)复合相似性函数(120)作为所述多个模板相似性函数的相应输出的加权组合;/n提供(606)第一多个标记的实体向量作为第一背景训练数据;/n应用(608)逼近函数,以针对所述第一背景训练数据的每个相应标记的实体向量,基于所述复合相似性函数的输出和所述第一背景训练数据的其他的标记的实体向量的相应第一背景标记来逼近针对相应标记的实体向量数据的第一背景标记;并且/n基于所述复合相似性函数来训练(610)第一背景特异性复合相似性函数,其中,训练所述第一背景特异性复合相似性函数包括基于所述逼近函数针对所述第一背景训练数据的所述应用的输出,使用第一损失函数来学习针对所述多个模板相似性函数的第一背景权重,其中,所述第一权重被存储以供用作所述第一背景特异性复合相似性函数的部分。/n

【技术特征摘要】
【国外来华专利技术】20170420 US 62/487,720;20171221 US 62/608,8781.一种训练用于确定相似性的背景特异性模型的方法,所述方法包括:
提供(602)多个模板相似性函数(118),其中,所述多个模板相似性函数中的每个模板相似性函数将查询实体特征向量的相应的特征子集与候选实体特征向量的对应的特征子集进行比较;
提供(604)复合相似性函数(120)作为所述多个模板相似性函数的相应输出的加权组合;
提供(606)第一多个标记的实体向量作为第一背景训练数据;
应用(608)逼近函数,以针对所述第一背景训练数据的每个相应标记的实体向量,基于所述复合相似性函数的输出和所述第一背景训练数据的其他的标记的实体向量的相应第一背景标记来逼近针对相应标记的实体向量数据的第一背景标记;并且
基于所述复合相似性函数来训练(610)第一背景特异性复合相似性函数,其中,训练所述第一背景特异性复合相似性函数包括基于所述逼近函数针对所述第一背景训练数据的所述应用的输出,使用第一损失函数来学习针对所述多个模板相似性函数的第一背景权重,其中,所述第一权重被存储以供用作所述第一背景特异性复合相似性函数的部分。


2.根据权利要求1所述的方法,还包括:
提供(612)第二多个标记的实体向量作为第二背景训练数据;
应用(614)所述逼近函数,以针对所述第二背景训练数据的每个相应标记的实体向量,基于所述复合相似性函数的输出和所述第二背景训练数据的其他的标记的实体向量的相应第二背景标记来逼近针对相应标记的实体向量数据的第二背景标记;并且
基于所述复合相似性函数来训练(616)第二背景特异性复合相似性函数,其中,训练所述第二背景特异性复合相似性函数包括基于所述逼近函数针对所述第二背景训练数据的所述应用的输出,使用第二损失函数来学习针对所述多个模板相似性函数的第二背景权重,其中,所述第二权重被存储以供用作所述第二背景特异性复合相似性函数的部分。


3.根据权利要求2所述的方法,其中,所述第一背景特异性复合相似性函数适用于后续查询实体特征向量和候选实体特征向量,以确定在第一医学背景中所述后续实体特征向量与所述候选实体特征向量之间的相似性度量;并且其中,所述第二背景特异性复合相似性函数适用于所述后续查询实体特征向量和所述候选实体特征向量,以确定在不同于所述第一医学背景的第二医学背景中所述后续实体特征向量与所述候选实体特征向量之间的另一相似性度量。


4.根据权利要求3所述的方法,其中,所述第一医学背景包括血液动力学稳定。


5.根据权利要求4所述的方法,其中,所述第二医学背景包括急性肾脏损伤。


6.根据权利要求1所述的方法,其中,提供所述多个模板相似性函数包括:
选择所述查询实体特征向量和所述候选实体特征向量共有的至少一个特征;
跨多个候选实体来确定针对所选择的特征的群体分布;
生成所述多个模板相似性函数中的给定的模板相似性函数,所述给定的模板相似性函数根据所述群体分布来计算具有在所述查询实体特征向量的选定特征值与所述候选实体特征向量的选定特征值之间的选定特征值的任何实体的累积概率得分。


7.根据权利要求6所述的方法,其中,基于所述查询实体特征向量和所述候选实体特征向量中的至少一个针对跨所述群体分布的其他实体的平均相似性得分对所述给定的模板相似性函数进一步进行标准化。


8.根据权利要求1所述的方法,其中,所述逼近函数包括内核平滑函数。


9.一种系统,包括一个或多个处理器以及与所述一个或多个处理器能操作地耦合的存储器,其中,所述存储器存储指令,所述指令响应于由一个或多个处理器对所述指令的运行而令所述一个或多个处理器执行以下操作:
提供(602)多个模板相似性函数(118),其中,所述多个模板相似性函数中的每个模板相似性函数将查询实体特征向量的相应的特征子集与候选实体特征向量的对应的特征子集进行比较;
提供(604)复合相似性函数(120)作为所述多个模板相似性函数的相应输出的加权组合;
提供(606)第一多个标记的实体向量作为第一背景训练数据;
应用(608)逼近函数,以针对所述第一背景训练数据的每个相应标记的实体向量,基于所述复合相似性函数的输出和所述第一背景训练数据的其他的标记的实体向量的相应第一背景标记来逼近针对相应标记的实体向量数据的第一背景标记;并且
基于所述复合相似性函数来训练(610)第一背景特异性复合相似性函数,其中,训练所述第一背景特异性复合相似性函数包括基于所述逼近函数针对所述第一背景训练数据的所述应用的输出,使用第一损失函数来学习针对所述多个模板相似性函数的第一背景权重,其中,所述第一权重被存储以供用作所述第一背景特异性复合相似性函数的部分。


10.根据权利要求9所述的系统,还包括执行以下操作的...

【专利技术属性】
技术研发人员:B·康罗伊许敏男A·拉赫曼C·M·波特斯布兰东
申请(专利权)人:皇家飞利浦有限公司
类型:发明
国别省市:荷兰;NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1