用于改善将具有相似简档的患者聚类在一起的聚类模型的性能的相关性反馈制造技术

技术编号:19397546 阅读:32 留言:0更新日期:2018-11-10 05:14
在患者群组识别中,使用取决于特征集(24)的患者比较度量来执行对患者的聚类(30)。显示关于根据所述聚类与查询患者相似或不相似样本患者的信息。接收将样本患者与查询患者进行比较的用户输入的比较值。调节该特征集合和/或特征权重以生成经调节的患者比较度量,其具有与用户输入的比较值的经改善的一致性。使用经调节的患者比较度量来重复所述聚类。从由最后一次聚类重复所产生的包含查询患者的聚类(34)中识别患者群组。可以通过同时显示两个或更多个图形模态表示(70、72、74)来示出关于样本患者的信息,每个图形模态表示将样本患者和查询患者针对模态的两个或更多个特征进行绘制。

【技术实现步骤摘要】
【国外来华专利技术】用于改善将具有相似简档的患者聚类在一起的聚类模型的性能的相关性反馈
下文总体涉及医学领域、电子临床决策支持(CDS)领域、临床研究领域、基因组学领域以及相关领域。
技术介绍
许多医学任务受益于识别具有相关相似性的患者群组。例如,在设计临床试验中的关键初始步骤是识别登记的临床试验中的患者。为了确保结果的有效性,登记的患者应当彼此足够相似,从而不同的患者结果能够被可靠地归因于临床试验的目标(例如,新的制药药物)而不是归因于由于诸如年龄差异、性别、种族、慢性医学状况的存在/不存在等外来因素(其中,这些与临床试验的目标无关)所导致的患者结果的差异。识别适合的患者以加入临床试验的任务是困难的,因为患者的结果会受到许多相关因素的影响。也能够在登记之后在对临床试验结果的分析期间实施群组识别。在登记之内,具有阳性结果相对于阴性结果的患者自然形成两个感兴趣群组。然而,可以基于阳性群组和阴性群组内的相似性和区别性来进一步分割这些群组,以识别和解释可能影响临床试验的原始数据结果的任何外来因素。相似群组识别任务是在其他类型的医学研究中执行的,例如以评估疾病风险因素或者执行组合来自许多先前研究的数据的“元研究”。其他医学任务包括对患者的临床诊断和处置。在这样的任务中,临床医师能够从当前患者与相似的过去的患者的比较中受益。同样地,识别“相似”患者的任务是具有挑战性的。没有两个患者是相同的,并且群组选择任务需要评估哪些差异是重要的还是不重要的。下文公开了解决上述问题和其他问题的新的并且经改进的系统和方法。
技术实现思路
在一个公开的方面中,公开了一种患者群组识别设备。计算机具有显示部件和至少一个用户输入设备。所述计算机与存储患者数据的患者数据库通信,所述患者数据包括针对所述患者数据库中的患者的特征的值。所述计算机被编程为执行包括以下内容的患者群组识别方法。对所述患者数据执行自动特征选择过程以选择特征的集合,并且使用取决于所述特征的集合的患者比较度量来执行对所述患者数据库中的患者的自动聚类。执行至少一次迭代,其包括:在所述显示部件上显示关于根据所述自动聚类与查询患者相似或不相似的一个或多个样本患者的信息;经由所述至少一个用户输入设备接收用户输入的比较值,所述用户输入的比较值将所述一个或多个样本患者与所述查询患者进行比较;调节所述患者比较度量以增大将所述一个或多个样本患者与所述查询患者进行比较的由所述患者比较度量计算的比较值与所述用户输入的比较值之间的一致性,其中,所述调节包括调节所述患者比较度量的特征的集合和特征权重中的至少一个;并且使用经调节的患者比较度量来重复所述自动聚类。使用由最后一次迭代产生的经调节的患者比较度量来识别针对所述查询患者的患者群组。在另一公开的方面中,公开了一种患者群组识别设备。计算机具有显示部件和至少一个用户输入设备。所述计算机与存储患者数据的患者数据库通信,所述患者数据包括针对所述患者数据库中的患者的特征的值。所述计算机被编程为执行患者群组识别方法,所述方法包括:在所述显示部件上同时显示两个或更多个图形模态表示,其中,每个图形模态表示针对模态的两个或更多个坐标特征来绘制所述数据库中的患者;在一个图形模态表示中接收对患者的聚类的选择;并且响应于接收到所述选择,在其他同时显示的一个或多个图形模态表示中突出显示患者的所选择的聚类中的患者。在另一公开的方面中,公开了一种患者群组识别方法,其与计算机协同地执行,所述计算机具有显示部件和至少一个用户输入设备并且与存储患者数据的患者数据库通信,所述患者数据包括针对所述患者数据库中的患者的特征的值。所述患者群组识别方法包括以下内容。使用取决于特征的集合的患者比较度量来执行对所述患者数据库中的患者的自动聚类。执行至少一次迭代,所述迭代包括:在所述显示部件上显示关于根据所述自动聚类与查询患者相似或不相似的一个或多个样本患者的信息;经由所述至少一个用户输入设备接收用户输入的比较值,所述用户输入的比较值将所述一个或多个样本患者与所述查询患者进行比较;调节所述患者比较度量的特征的集合和特征权重中的至少一个,以生成经调节的患者比较度量,与没有所述调节的患者比较度量相比较,经调节的患者比较度量具有与用户输入的比较值的经改善的一致性;并且使用经调节的患者比较度量来重复所述自动聚类。针对所述查询患者的患者群组被识别为通过最后一次迭代的自动聚类重复而产生的包含所述查询患者的聚类的至少部分。一个优点在于提供了来自临床医师的相关性反馈以改进群组选择。另一优点在于基于临床医师的整体患者水平分析为群组选择提供了相关性反馈。另一优点在于提供了来自临床医师的用于选择相关特征的相关反馈,而无需临床医师执行特征水平分析。另一优点在于提供了图形用户界面,经由所述图形用户界面,临床医师能够对不同模态(临床学、放射学、基因组学、人口统计学、生理学等)的相互关系进行可视化。给定实施例可以不提供前述优点中的任何一个优点,可以提供前述优点中的一个、两个、更多个或全部优点,和/或可以提供其他优点,这对于本领域普通技术人员在阅读和理解本公开内容后将变得显而易见。附图说明本专利技术可以采用各种部件和部件布置以及各种步骤和步骤安排的形式。附图仅用于例示说明优选实施例的目的,而不应当被解释为限制本专利技术。图1示意性图示了患者群组识别设备。图2示意性图示了由图1的患者群组识别设备适当地执行的患者群组识别方法。图3和图4示意性示出了图2的方法的呈现操作的合适的实施例的两个例示性范例。图5示意性示出了如在本文中所描述的患者群组视觉表示和导航工具。具体实施方式在本文中认识到,通过选择适当的(缩减的)患者特征集合以将患者分组为群组能够降低选择群组的复杂性。用于选择群组的所述患者特征集合应当包括与手头的医学任务相关的那些患者特征(例如,选取患者加入临床试验,或者选取与当前在临床诊断中的患者相似的患者等),并且不应当包括与该医学任务不相关的那些患者特征。特征选择是重要的,因为可用的患者特征的数量通常是相当大的,并且例如可以包括:人口统计学数据(年龄、性别、体重、种族等);存在/不存在慢性行为状况(吸烟、重度饮酒、消费各种娱乐性药物等);存在/不存在各种慢性临床状况(高血压、糖尿病、哮喘、心脏病等);存在/不存在各种急性疾病(肺炎或其他急性呼吸系统疾病、各种肿瘤状况等);与其相关的特征(例如,癌症分期和分级);等等。快速发展的基因组学领域正在迅速添加到可用的患者特征的列表中,因为基因测序能够提供丰富的基因组标记,所述基因组标记与各种医学状况具有不同的已知或疑似的相关性。例如,一些医学数据库包含定义数几百个或更多个特征的数据,而基因组数据的可用性的持续扩展可能将患者的特征的数量增大到数千个。这样的大的特征空间对于选取针对临床任务的群组的“最佳”特征集合提出了重大挑战。已知许多无监督的(缩减的)特征集合选择技术。典型的自动特征选择技术测量特征的辨别力,并且选择最具辨别力的特征。一种这样的技术是主成分分析(PCA),其选择特征以便捕获具有缩减数量的特征的数据集的方差。能够采用其他区别度量,诸如每个特征的信息增益(IG)或者各种成对特征相关性度量(例如,选择提供最高IG的特征,或者消除与其他特征强相关的特征)。尽管功能强大,但是无监督的自动特征集合选本文档来自技高网...

【技术保护点】
1.一种患者群组识别设备,包括:具有显示部件(14)和至少一个用户输入设备(16、18)的计算机(10、12),所述计算机与存储患者数据的患者数据库(20)通信,所述患者数据包括针对所述患者数据库中的患者的特征的值,所述计算机被编程为执行患者群组识别方法,所述方法包括:对所述患者数据执行(50)自动特征选择过程(22)以选择特征的集合(24),并且使用取决于所述特征的集合的患者比较度量对所述患者数据库中的患者进行自动聚类(52);执行以下的至少一次迭代:在所述显示部件上显示(54)关于根据所述自动聚类与查询患者相似或不相似的一个或多个样本患者的信息,并且经由所述至少一个用户输入设备接收(56)将所述一个或多个样本患者与所述查询患者进行比较的用户输入的比较值;调节(60)所述患者比较度量以增大将所述一个或多个样本患者与所述查询患者进行比较的由所述患者比较度量计算的比较值与所述用户输入的比较值之间的一致性,其中,所述调节包括调节以下中的至少一项:所述患者比较度量的所述特征的集合和特征权重;并且使用经调节的患者比较度量来重复(62)所述自动聚类;并且使用由最后的迭代产生的所述经调节的患者比较度量来识别针对所述查询患者的患者群组。...

【技术特征摘要】
【国外来华专利技术】2016.03.16 US 62/309,0671.一种患者群组识别设备,包括:具有显示部件(14)和至少一个用户输入设备(16、18)的计算机(10、12),所述计算机与存储患者数据的患者数据库(20)通信,所述患者数据包括针对所述患者数据库中的患者的特征的值,所述计算机被编程为执行患者群组识别方法,所述方法包括:对所述患者数据执行(50)自动特征选择过程(22)以选择特征的集合(24),并且使用取决于所述特征的集合的患者比较度量对所述患者数据库中的患者进行自动聚类(52);执行以下的至少一次迭代:在所述显示部件上显示(54)关于根据所述自动聚类与查询患者相似或不相似的一个或多个样本患者的信息,并且经由所述至少一个用户输入设备接收(56)将所述一个或多个样本患者与所述查询患者进行比较的用户输入的比较值;调节(60)所述患者比较度量以增大将所述一个或多个样本患者与所述查询患者进行比较的由所述患者比较度量计算的比较值与所述用户输入的比较值之间的一致性,其中,所述调节包括调节以下中的至少一项:所述患者比较度量的所述特征的集合和特征权重;并且使用经调节的患者比较度量来重复(62)所述自动聚类;并且使用由最后的迭代产生的所述经调节的患者比较度量来识别针对所述查询患者的患者群组。2.根据权利要求1所述的患者群组识别设备,其中,所述识别包括:将所述患者群组识别为由所述自动聚类的最后的重复(62)生成的包含所述查询患者的聚类(34)的至少部分。3.根据权利要求1-2中的任一项所述的患者群组识别设备,其中,所述显示(54)和所述接收(56)包括:在所述显示部件(14)上显示关于属于由最新近执行的自动聚类生成的也包含所述查询患者的聚类(34)的一个或多个相似样本患者的信息。4.根据权利要求1-2中的任一项所述的患者群组识别设备,其中,所述显示(54)和所述接收(56)包括:在所述显示部件(14)上显示关于不属于由最新近执行的自动聚类生成的包含所述查询患者的聚类(34)的一个或多个不相似样本患者的信息。5.根据权利要求1-4中的任一项所述的患者群组识别设备,其中,所述显示(54)和所述接收(56)包括,针对至少一个样本患者:显示在定量排序标度上对所述样本患者与所述查询患者的相似性进行排序的请求;并且接收针对所述样本患者的所述用户输入的比较值作为在所述定量排序标度上对所述样本患者的接收到的相似性排序。6.根据权利要求1-5中的任一项所述的患者群组识别设备,其中,所述显示(54)和所述接收(56)包括,针对两个样本患者:显示对选择所述两个样本患者中的哪一个样本患者与所述查询患者最相似的请求;并且接收用户输入的比较值作为对所述两个样本患者中的哪一个样本患者与所述查询患者最相似的接收到的选择。7.根据权利要求1-6中的任一项所述的患者群组识别设备,其中,所述显示(54)包括:同时显示两个或更多个图形模态表示(70、72、74),其中,每个图形模态表示针对所述模态的两个或更多个特征来绘制所述一个或多个样本患者以及所述查询患者。8.根据权利要求7所述的患者群组识别设备,其中,所述两个或更多个图形模态表示(70、72、74)包括针对从包括以下项的组中选择的模态的图形模态表示:临床学模态、放射学模态、基因组学模态、人口统计学模态和生理学模态。9.根据权利要求1-8中的任一项所述的患者群组识别设备,其中,所述调节(60)包括执行多次特征集合调节迭代,每次特征集合调节迭代包括:(1)通过添加或移除特征来调节所述特征的集合以产生候选的经调节的特征的集合;(2)使用具有所述候选的经调节的特征的集合的所述患者比较度量来计算比较值,所述比较值将所述一个或多个样本患者与所述查询患者进行比较;(3)基于在操作(2)中计算的所述比较值与所述用户输入的比较值的一致性是增大还是减小来分别接受或拒绝所述候选的经调节的特征的集合。10.根据权利要求1-8中的任一项所述的患者群组识别设备,其中,所述调节(60)包括执行降维以减小特征集合中的特征的数量。11.根据权利要求1-10中的任一项所述的患者群组识别设备,其中,所述调节(60)包括调节所述患者比较度量的特征权重。12.根据权利要求11所述的患者群组识别设备,其中,所述调节(60)包括执行多次特征权重调节迭代,每次特征权重调节迭代包括:(1)通过增大或减小所述患者比较度量的至少一个特征权重的值来调节所述患者比较度量,以产生候选的经调节的患者比较度量;...

【专利技术属性】
技术研发人员:V·阿格拉瓦尔A·R·曼科维赫N·迪米特罗娃N·班纳吉Y·H·张J·M·德邦特J·H·M·瑞吉马克思
申请(专利权)人:皇家飞利浦有限公司
类型:发明
国别省市:荷兰,NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1