用于数字病理学的主动学习系统技术方案

技术编号:37465183 阅读:28 留言:0更新日期:2023-05-06 09:38
访问一种机器学习模型,所述机器学习模型配置成使用一个或多个参数来处理图像以生成标记。执行所述机器学习模型以将至少一个数字病理学图像中的每一个的至少一部分转换成多个预测标记;并且为所述多个预测标记中的每一个生成置信度度量。利用一种界面,所述界面描绘所述至少一个数字病理学图像的所述至少一部分并且基于对应的置信度度量差异性地表示预测标记。响应于所述界面的利用,接收确认、拒绝或替换所述多个预测标记中的至少一个的标记输入。基于所述标记输入更新所述机器学习模型的所述一个或多个参数。型的所述一个或多个参数。型的所述一个或多个参数。

【技术实现步骤摘要】
【国外来华专利技术】用于数字病理学的主动学习系统
[0001]相关申请的交叉引用
[0002]本申请要求于2020年8月13日提交的美国临时专利申请编号63/065,404的权益和优先权,所述美国临时专利申请出于所有目的通过引用以其全文并入本文。


[0003]本公开涉及数字病理学,尤其涉及使用主动学习有效地训练机器学习模型以自动检测、表征和/或分类部分或全部数字病理学图像的技术。

技术介绍

[0004]数字病理学涉及将载玻片(例如,组织病理学或细胞病理学载玻片)扫描成数字图像。出于包括疾病诊断、对疗法的应答的评估以及药物制剂的开发以对抗疾病的多种原因,数字图像内的组织和/或细胞可随后使用数字病理学图像分析进行检查和/或由病理学家进行解释。为了检查数字图像(其几乎是透明的)内的组织和/或细胞,可使用选择性结合到特定组织和/或细胞组分的各种染色测定(例如,免疫染色剂)来制备病理学载玻片。
[0005]训练用于分析数字病理学图像的机器学习模型需要大量图像,这些图像手动标记有基准真值。例如,手动标记可包括标识图像内特定区域内给定类型的每个细胞(例如,肿瘤细胞)的位置(例如,点位置和/或边界)。制作这些标记图像收集起来既乏味又费时。此外,由于隐私问题,获得训练图像可能很困难。
[0006]目前,为了收集基准真值以准备训练数据集,选择图像或选择要标记的图像的部分是从数据池(例如,可用图像)中随机选择的。然而,随机挑选要标记的图像或图像的部分并不是一种有效的方法。作为随机选择的样品的图像或图像的部分可能不是训练机器学习模型时提供最多信息的图像,并且可能缺乏目标描述。因此,标记随机选择的图像或随机选择的图像的部分会浪费资源(例如病理学家的时间和模型训练中涉及的计算资源),而不会为训练过程增加任何价值。

技术实现思路

[0007]通过参考附图描述实例,各种实施例的方面和特征将更加明显,其中:
[0008]在一些实施例中,提供了一种用于在数字病理学系统中进行主动学习的方法。访问一种机器学习模型,所述机器学习模型配置成使用一个或多个参数来处理图像以生成标记。执行机器学习模型以将至少一个数字病理学图像中的每一个的至少一部分转换成多个预测标记;并且为多个预测标记中的每一个生成置信度度量。利用一种界面,所述界面描绘至少一个数字病理学图像的至少一部分并且基于对应的置信度度量差异性地表示预测标记。响应于界面的利用,接收确认、拒绝或替换多个预测标记中的至少一个的标记输入。基于标记输入更新机器学习模型的一个或多个参数。
[0009]方法还可包括一个或多个额外动作。
[0010]一个或多个额外动作可包括为数字病理学图像生成确定性图,其中数字病理学图
的每个部分的值与对应于部分内的点位置或区域的一个或多个置信度度量的统计数据对应,其中利用界面包括利用确定性图的表示。
[0011]界面配置成:接收输入以表示与一个放大级别的区域置信度度量有关的统计数据;表示另一个放大级别的置信度度量;以及接收输入以改变放大级别。
[0012]一个或多个额外动作可包括:接收新数字病理学图像;将新数字病理学图像转换成一个或多个新标记,所述标记表征新数字病学理图像或新数字病理学图像的部分;以及输出一个或多个新标记。
[0013]一个或多个额外动作可包括预处理数字病理学图像的初始版本以检测每个目标特征的位置,其中转换数字病理学图像的至少一部分包括生成对应于数字病理学图像中的至少一部分内的每个检测到的目标位置的标记。
[0014]一个或多个额外动作可包括基于预测标记的置信度度量,为多个预测标记中的每一个来选择标志物的大小、颜色或形状,其中界面通过使用标志物使用具有所选大小、颜色或形状的标志物表示多个预测标记中的每个预测标记基于对应的置信度度量来差异性地表示预测标记。
[0015]机器学习模型可包括深度神经网络。
[0016]在一些实施例中,提供了一种方法,其包括由用户基于由使用本文公开的一种或多种技术的部分或全部训练的机器学习模型生成的结果来确定受试者的诊断,以及可能基于诊断针对受试者选择、推荐和/或进行特定治疗。
[0017]在一些实施例中,提供了一种方法,其包括由用户基于由使用本文公开的一种或多种技术的部分或全部训练的机器学习模型生成的结果来确定针对受试者选择、推荐和/或进行的治疗。
[0018]在一些实施例中,提供了一种方法,其包括由用户确定受试者是否有资格参与临床研究或基于由使用本文公开的一种或多种技术的部分或全部训练的机器学习模型生成的结果将受试者分配到临床研究中的特定队列。
[0019]在一些实施例中,提供了一种系统,其包括一个或多个数据处理器和包含指令的非暂时性计算机可读存储介质,所述指令当在一个或多个数据处理器上执行时,使一个或多个数据处理器执行本文公开的一种或多种方法的部分或全部。
[0020]在一些实施例中,提供了一种计算机程序产品,其有形地体现在非暂时性机器可读存储介质中,并且所述计算机程序产品包括指令,所述指令配置成使一个或多个数据处理器执行本文公开的一种或多种方法的部分或全部。
[0021]已采用的术语和表达被用作描述性而非限制性的术语,并且在使用这些术语和表达时,无意排除所示出和描述的特征或其部分的任何等同物,但是应当认识到,在所要求保护的本专利技术的范围内,各种修改是可能的。因此,应当理解,尽管已通过实施例和任选特征具体地公开了所要求保护的本专利技术,但是本领域技术人员可采用本文所公开的概念的修改和变化,并且认为这样的修改和变化在由所附权利要求限定的本专利技术范围内。
附图说明
[0022]专利或申请文件包含至少一幅彩色图式。在提出请求并支付必要的费用后,专利局将提供带有一幅或多幅彩色图式的本专利或专利申请公布的副本。
[0023]通过参考附图描述实例,各种实施例的方面和特征将更加明显,其中:
[0024]图1示出了组织学染色过程的实例。
[0025]图2示出了用于使用机器学习模型处理数字病理学图像的(使用一个或多个计算系统执行的)过程流程。
[0026]图3示出了根据本公开的一些方面的主动学习工作流程。
[0027]图4示出了用于使用部分或全部数字病理学过程流程的示例性工作流程。
[0028]图5公开了具有可在此方面中使用的示例性系统和应用程序的网络500。
[0029]图6A至6D描绘了整个载玻片图像的部分或全部的示例性图像,以促进接收用于训练机器学习模型的标记。
具体实施方式
[0030]虽然描述了某些实施例,但这些实施例仅以示例的方式呈现,且并不旨在限制保护范围。本文描述的设备、方法和系统可以多种其他形式体现。此外,在不脱离保护范围的情况下,可对本文描述的实例方法和系统的形式进行各种省略、替换和变化。
[0031]I.概述
[0032]在各种实施例中,提供了一种用于数字病理学的主动学习系统,其动态地选择数据集内的特定元素以被标记以用于训练机器学本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于在数字病理学系统中主动学习的方法,其包括:访问机器学习模型,所述机器学习模型配置成使用一个或多个参数来处理图像以生成标记;执行所述机器学习模型以:将至少一个数字病理学图像中的每一个的至少一部分转换成多个预测标记;以及为所述多个预测标记中的每一个生成置信度度量;利用一种界面,所述界面描绘所述至少一个数字病理学图像的所述至少一部分并且基于对应的置信度度量差异性地表示预测标记;响应于所述界面的利用而接收确认、拒绝或替换所述多个预测标记中的至少一个的标记输入;以及基于所述标记输入更新所述机器学习模型的所述一个或多个参数。2.根据权利要求1所述的方法,其进一步包括:为所述数字病理学图像生成确定性图,其中所述数字病理学图的像每的每个部分的值与对应于所述部分内的点位置或区域的一个或多个置信度度量的统计数据对应;其中利用所述界面包括利用所述确定性图的表示。3.根据权利要求1或权利要求2所述的方法,其中所述界面配置成:接收输入以表示与一个放大级别的区域置信度度量有关的统计数据;表示另一个放大级别的置信度度量;以及接收输入以改变所述放大级别。4.根据权利要求1至3中任一项所述的方法,其进一步包括:接收新数字病理学图像;将所述新数字病理学图像转换成一个或多个新标记,所述新标记表征所述新数字病理学学理图像或所述新数字病理学图像的部分;以及输出所述一个或多个新标记。5.根据权利要求1至4中任一项所述的方法,其进一步包括:预处理所述数字病理学图像的初始版本以检测每个目标特征的位置,其中转换所述数字病理学图像的所述至少一部分包括生成对应于所述数字病理学图像中的所述至少一部分内的每个检测到的目标位置的标记。6.根据权利要求1至5中任一项所述的方法,其进一步包括:基于所述预测标记的所述置信度度量,为所述多个预测标记中的每一个选择标志物的大小、颜色或形状,其中所述界面通过使用标志物使用具有所述所选大小、颜色或形状的标志物表示所述多个预测标记中的每个预测标记基于对应的置信度度量来差异性地表示预测标记。7.根据权利要求1至6中任一项所述的方法,其中所述机器学习模型包括深度神经网络。8.一种系统,其包括:一个或多个数据处理器;以及非暂时性计算机可读存储介质,其包含指令,所述指令当在所述一个或多个数据处理
器上执行时,使所述一个或多个数据处理器执行包括以下的一组操作:访问机器学习模型,所述机器学习模型配置成使用一个或多个参数来处理图像以生成标记;执行所述机器学习模型以:将至少一个数字病理学图像中的每一个的至少一部分转换成多个预测标记;以及为所述多个预测标记中的每一个生成置信度度量;利用一种界面,所述界面描绘所述至少一个数字病理学图像的所述至少一部分并且基于对应的置信度度量差异性地表示预测标记;响应于所述界面的利用而接收确认、拒绝或替换所述多个预测标记中的至少一个的标记输入;以及基于所述标记输入更新所述机器学习模型的所述一个或多个参数。9.根据权利要求8所述的系统,其中所述一组操作进一步包括:为所述数字病理学图像生成确定性图,其中所述数字病理学图的像的每每个部分的值与对应于所述部分内的点位置或区域的一个或多个置信度度量的统计数据对应;其中利用所述界面包括利用所述确定性图的表示。10.根据权利要求8或权利要求9所述的系统,其中所述界面配置成:接收输入以表示与一个放大级别的区域置信度度量有关的统计数据;表示另一个放大级别的置信度度量;以及接收...

【专利技术属性】
技术研发人员:H
申请(专利权)人:文塔纳医疗系统公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1