用于处理通用疾病检测的电子图像的系统和方法技术方案

技术编号:35244836 阅读:14 留言:0更新日期:2022-10-19 09:51
公开了用于通过以下方式生成专用机器学习模型的系统和方法:接收通过处理多个第一训练图像以预测至少一个癌症特性而生成的通用机器学习模型;接收多个第二训练图像,所述第一训练图像和所述第二训练图像包括组织样本的图像和/或通过算法生成以复制组织样本的图像;接收多个目标专用属性,目标专用属性与多个第二训练图像中的相应第二训练图像相关;通过基于所述多个第二训练图像和目标专用属性修改通用机器学习模型来生成专用机器学习模型;接收对应于目标样本的目标图像;将专用机器学习模型应用于目标图像,以确定目标图像的至少一个特性;以及输出目标图像的特性。以及输出目标图像的特性。以及输出目标图像的特性。

【技术实现步骤摘要】
【国外来华专利技术】用于处理通用疾病检测的电子图像的系统和方法
[0001](一个或多个)相关申请本申请要求2020年1月3日提交的美国临时申请第62/956,876号的优先权,其全部公开内容由此通过引用以其整体合并到本文中。


[0002]本公开的各种实施例一般涉及基于图像的样本分类和相关图像处理方法。更具体地,本公开的特定实施例涉及用于处理图像以开发用于临床和临床前研究中生物标志物开发的通用泛癌机器学习模型的系统和方法。

技术介绍

[0003]在肿瘤学研究中,对不同患者组进行分层以开发个性化治疗策略、测量肿瘤进展和/或评估治疗效果变得越来越重要。这样的分层的当前实践是使用与大多数机器学习系统的需求相比相对小的临床试验样本。例如,许多III期临床试验登记少于5000名患者,而I期和II期临床试验登记甚至更少的患者(例如,I期一般登记少于100名患者,II期一般登记少于300名患者)。由于过度拟合,对这些小数据集使用深度学习和许多其它端到端机器学习技术具有挑战性,这导致模型做出不准确的预测。
[0004]因此,将机器学习技术应用于深度学习和具有小数据集(诸如经由临床试验提供的数据集)的其它端到端机器学习技术将是有益的。
[0005]前述一般描述和以下详细描述仅是示例性和解释性的,并不限制本公开。本文中提供的背景描述是出于一般呈现本公开的上下文的目的。除非本文中另有指示,否则本节中描述的材料不是本申请中权利要求的现有技术,并且不通过包含在本节中而被承认为现有技术或现有技术的建议。

技术实现思路

[0006]根据本公开的某些方面,公开了用于从组织样本的图像分析标识或验证样本类型或样本性质的系统和方法。
[0007]一种用于生成专用机器学习模型的方法,包括接收通过处理多个第一训练图像生成的通用机器学习模型以预测至少一个癌症特性;接收多个第二训练图像,其中所述第一训练图像和所述第二训练图像包括组织样本的图像和/或通过算法生成以复制组织样本的图像;接收多个目标专用属性,每个目标专用属性与多个第二训练图像中的相应第二训练图像相关;通过基于多个第二训练图像和相应目标专用属性修改通用机器学习模型来生成专用机器学习模型;接收对应于目标样本的目标图像;将专用机器学习模型应用于目标图像以确定目标图像的至少一个特性;以及输出目标图像的至少一个特性。
[0008]一种用于生成专用机器学习模型的系统,包括存储指令的存储器;以及处理器,执行指令以施行过程,包括接收通过处理多个第一训练图像生成的通用机器学习模型以预测至少一个癌症特性;接收多个第二训练图像,其中所述第一训练图像和所述第二训练图像
包括组织样本的图像和/或通过算法生成以复制组织样本的图像;接收多个目标专用属性,每个目标专用属性与多个第二训练图像中的相应第二训练图像相关;通过基于多个第二训练图像和相应目标专用属性修改通用机器学习模型来生成专用机器学习模型;接收对应于目标样本的目标图像;将专用机器学习模型应用于目标图像以确定目标图像的至少一个特性;以及输出目标图像的至少一个特性。
[0009]一种存储指令的非暂时性计算机可读介质,所述指令当由处理器执行时,使处理器施行用于生成专用机器学习模型的方法,所述方法包括接收通过处理多个第一训练图像生成的通用机器学习模型以预测至少一个癌症特性;接收多个第二训练图像,其中所述第一训练图像和所述第二训练图像包括组织样本的图像和/或通过算法生成以复制组织样本的图像;接收多个目标专用属性,每个目标专用属性与多个第二训练图像中的相应第二训练图像相关;通过基于多个第二训练图像和相应目标专用属性修改通用机器学习模型来生成专用机器学习模型;接收对应于目标样本的目标图像;将专用机器学习模型应用于目标图像以确定目标图像的至少一个特性;以及输出目标图像的至少一个特性。应当理解,前述的一般描述和以下的详细描述二者都仅是示例性和解释性的,而不是对所公开的实施例的限制,如所要求保护的。
附图说明
[0010]合并在本说明书中并构成其一部分的附图图示了各种示例性实施例,并与描述一起用于解释所公开实施例的原理。
[0011]图1A图示了根据本公开示例性实施例的用于基于(一个或多个)病理学图像确定一个或多个特性的系统和网络的示例性框图。
[0012]图1B图示了根据本公开示例性实施例的机器学习模型的示例性框图。
[0013]图2是图示根据本公开示例性实施例的用于生成专用机器学习模型以输出目标图像的特性的示例性方法的流程图。
[0014]图3图示了根据本公开示例性实施例的训练模块的示例性框图。
[0015]图4图示了根据本公开示例性实施例的通用机器学习模型和专用机器学习模型的图解。
[0016]图5是根据本公开示例性实施例的药物反应预测的示例性实施例的流程图。
[0017]图6是根据本公开示例性实施例的癌症复发预测的示例性实施例的流程图。
[0018]图7是根据本公开示例性实施例的药物毒性和组织异常预测的示例性实施例的流程图。
[0019]图8描绘了可以执行本文中所呈现技术的示例系统。
具体实施方式
[0020]现在将详细参考本公开的示例性实施例,其示例在附图中图示。贯穿各附图,将尽可能使用相同的附图编号来指代相同或类似的部分。如本文中所使用的,术语“示例性的”是在“示例”的意义上使用的,而不是“理想的”。此外,本文中的术语“一”和“一个”并不标示数量的限制,而是标示存在一个或多个所引用的项目。在以下的讨论中,诸如“大约”、“大体上”、“近似”之类的相对术语用于在规定值、数值或其它方面的
±
10%或更少的可能变化。
[0021]本文中公开的系统、设备和方法通过示例的方式并参考附图进行了详细描述。本文中讨论的示例仅是示例,并且被提供来帮助解释本文中描述的装置、设备、系统和方法。除非具体指定为强制性的,否则附图中所示出的或下面讨论的特征或组件都不应该被理解为对于这些设备、系统或方法中的任何一个的任何特定实现是强制性的。
[0022]此外,对于所描述的任何方法,不管该方法是否结合流程图进行描述,应当理解,除非上下文另有指定或要求,否则在方法执行时施行的步骤的任何显式或隐式次序并不意味着那些步骤必须按所呈现的次序施行,而是可以按不同次序或并行施行。
[0023]如本文中所使用的,术语“示例性”在“示例”而不是“理想”的意义上使用。此外,本文中的术语“一”和“一个”并不标示数量的限制,而是标示存在一个或多个所引用的项目。
[0024]病理学指的是对疾病的研究。更具体地,病理学指的是施行用于诊断疾病的测试和分析。例如,组织样本可以放置在载玻片上,由病理学家(例如,擅长分析组织样本以确定是否存在任何异常的医生)在显微镜下观察。也就是说,病理学样本可以被切割成多个切片、染色并制备为载玻片,以供病理学家检查并给出诊断。当不确定载玻片上的诊断结果时,病理学家可能要求附加的切割水平、染色或其它测试,以从组织收集更多信息。然后,(一个或多个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于处理电子图像的计算机实现的方法,所述方法包括:接收通过处理多个第一训练图像以预测至少一个癌症特性而生成的通用机器学习模型;接收多个第二训练图像,其中所述第一训练图像和所述第二训练图像包括组织样本的图像和/或通过算法生成以复制组织样本的图像;接收多个目标专用属性,每个目标专用属性与多个第二训练图像中的相应第二训练图像相关;通过基于所述多个第二训练图像和相应目标专用属性修改通用机器学习模型来生成专用机器学习模型;接收对应于目标样本的目标图像;将专用机器学习模型应用于目标图像,以确定目标图像的至少一个特性;以及输出目标图像的至少一个特性。2. 根据权利要求1所述的计算机实现的方法,进一步包括:基于目标图像的至少一个特性来确定目标样本的样本类型的预测;和输出对目标样本的样本类型的预测。3.根据权利要求1所述的计算机实现的方法,其中所述多个目标专用属性是存在于每个相应第二训练图像中的一个或多个生物标志物。4.根据权利要求1所述的计算机实现的方法,其中所述通用机器学习模型包括多个层,并且修改通用机器学习模型包括修改通用机器学习模型的一个或多个外层。5.根据权利要求1所述的计算机实现的方法,其中修改通用机器学习模型包括移除通用机器学习模型的输出层。6.根据权利要求1所述的计算机实现的方法,其中所述多个目标专用属性是存在于每个相应第二训练图像中的一个或多个生物标志物。7.根据权利要求1所述的计算机实现的方法,其中所述多个目标专用属性基于药物反应信息、癌症复发预测信息或毒性评估信息中的至少一个。8.根据权利要求1所述的计算机实现的方法,其中每个第二训练图像是基于相同类别的病理学样本生成的。9.根据权利要求8所述的计算机实现的方法,其中病理学样本的类别选自组织学、细胞学、免疫组织化学或其组合。10.根据权利要求1所述的计算机实现的方法,其中修改通用机器学习模型进一步包括调整通用机器学习模型以具有基于目标专用属性的输出。11.根据权利要求1所述的计算机实现的方法,其中所述多个第一训练图像包括对应于多种癌症类型的图像。12.根据权利要求1所述的计算机实现的方法,其中所述至少一个癌症特性是癌症诊断、肿瘤表征或生物标志物检测之一。13. 一种用于处理电子图像的系统,所述系统包括:至少一个存储指令的存储器;和至少一个处理...

【专利技术属性】
技术研发人员:B
申请(专利权)人:佩治人工智能公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1