根据合成数据利用机器学习的基于图像的肿瘤表型分析制造技术

技术编号:16839037 阅读:37 留言:0更新日期:2017-12-19 20:54
本发明专利技术涉及根据合成数据利用机器学习的基于图像的肿瘤表型分析。机器训练以及机器训练的分类器的应用被用于医学系统中的基于图像的肿瘤表型分析。为了利用已知表型信息创建训练数据库,合成医学图像被创建。计算肿瘤模型创建组织中的肿瘤的各种示例。使用所述计算肿瘤模型允许一个人创建不可从实际的患者得到的示例,从而增加用于机器学习以预测肿瘤表型的示例的数量和变化。成像系统的模型从所述示例生成合成图像。所述机器训练的分类器被应用于来自实际的患者的图像,以基于从所述合成图像学习到的知识来预测该患者的肿瘤表型。

Image based tumor phenotype analysis based on synthetic data using machine learning

The present invention relates to an image based tumor phenotype analysis that is learned by machine based on synthetic data. The application of classifier for machine training and machine training is used in image based tumor phenotype analysis in medical systems. In order to create a training database using known phenotypic information, synthetic medical images are created. A variety of examples of tumors in the tumor model were calculated to create a tumor model. Using the computational tumor model allows one to create examples that can not be obtained from actual patients, thereby increasing the number and variation of examples for machine learning to predict tumor phenotypes. The model of the imaging system generates a synthetic image from the example described. The machine trained classifier is applied to the images from the actual patients, based on the knowledge learned from the synthesized images, to predict the tumor phenotype of the patient.

【技术实现步骤摘要】
根据合成数据利用机器学习的基于图像的肿瘤表型分析相关申请本专利文件根据美国法典第35条119(e)款要求2016年6月9日提交的临时美国专利申请序号62/347,864的权益,其据此通过引用结合。
技术介绍
本实施例涉及针对肿瘤的医学诊断、治疗计划和/或预后。成像是用于预测和监测癌症的治疗反应的一个重要的诊断工具。当前的方法一般地依赖从医学图像得到的肿瘤的聚合特性。这些特性可以包括肿瘤大小(例如,被测量为线性尺寸或体积)或强度参数(例如,灌注特性)。这些方法未计及常常通过解剖、生理和分子图像的纹理和多参数空间图案所捕获的可从肿瘤基质和生理学的空间分布得到的丰富信息。根据单个图像时间点或根据作为时间的函数的图像中的改变的反应预测就是这样的。
技术实现思路
通过介绍,在下面所描述的优选实施例包括用于机器训练的方法、计算机可读介质和系统以及机器训练的分类器对于医学系统中的基于图像的肿瘤表型分析(phenotyping)的应用。为了利用已知表型信息创建足够丰富的训练数据库,合成医学图像被创建。这是至关重要的,因为每个肿瘤是唯一的并且数据扩增是机器训练的算法的最优性能所必要的。计算肿瘤模型创建肿瘤类型的各种示例。使用所述计算肿瘤模型提供不可从实际的患者得到的训练数据示例,从而增加用于机器学习以预测肿瘤表型的示例的数量和变化。成像系统的模型从所述示例生成合成图像。所述机器训练的分类器被应用于来自实际的患者的图像,以基于从所述合成图像学习到的知识来预测该患者的肿瘤表型。在第一方面,提供了一种用于医学系统中的基于图像的肿瘤表型分析的方法。表示患者的组织中的肿瘤的医学扫描数据被获取。从所述医学扫描数据中提取一组特征。所述特征被输入到机器训练的分类器。所述机器训练的分类器至少部分地根据不特定于针对现有患者案例的训练数据的合成地生成的图像并且基于肿瘤模型被训练。通过将所述机器训练的分类器应用于所述特征,所述肿瘤的表型信息被确定。所述表型信息被输出。在第二方面,提供了一种用于医学系统中的基于图像的肿瘤表型分析的机器训练的方法。计算肿瘤模型的参数被改变。所述改变提供肿瘤的一组合成地生成的示例。医学图像是从所述肿瘤的合成地生成的示例仿真的。机器使用所仿真的医学图像来训练机器学习分类器。在第三方面,提供了一种用于医学系统中的基于图像的肿瘤表型分析的机器训练的方法。肿瘤生长或萎缩被建模。合成图像根据对肿瘤生长或萎缩的所述建模利用图像模型来创建。机器被训练以根据包括从对所述肿瘤生长或萎缩的所述建模创建的所述图像的训练数据的数据库来预测。本专利技术由以下权利要求来限定,并且此部分中没什么应该被视为是对那些权利要求的限制。本专利技术的进一步方面和优点在下面结合优选实施例被讨论,并且可以被稍后独立地或相结合地要求保护。附图说明组件和图未必按比例绘制,重点替代地被放在图示本专利技术的原理上。而且,在图中,相同的附图标记在不同的视图中自始至终指代对应的部分。图1是示出了基于肿瘤的计算模型的机器学习的布置;图2是用于医学系统中的基于图像的肿瘤表型分析的方法的一个实施例的流程图;图3是用于医学系统中的基于图像的肿瘤表型分析的机器训练的方法的一个实施例的流程图;以及图4是用于基于图像的肿瘤表型分析的医学系统的一个实施例的框图。具体实施方式来自患者图像和测量结果的数据的合集呈现关于患者的非常复杂的信息网络。此复杂的信息网络可以通过现代的机器学习算法有效地理清。机器学习分类器提供快速的患者评估和疗效分析。现代的机器学习和人工智能算法很适于管理大量的异构数据。一致预测是以自动化方式提供的。机器学习算法在复杂任务方面具有优良的预测能力,示出专家级性能。综合患者评估模型组合来自患者的所有可用的信息,以呈现对患者状态的综合理解以及使得临床医师能够指导治疗。机器学习可以被用于基于图像的非侵入性肿瘤表型分析以用于诊断、预后和治疗。量化预测并反映响应于特定治疗的进展并且与最终患者疗效有关的肿瘤表型特性可能潜在地由于若干原因而显著地受益于自动化计算机分析。计算机分析是高度可再现的并且不取决于主观评估。精确量化很可能改进对肿瘤的微妙特性和响应于治疗的改变的检测,这预测将来的疗效。使用大量数据来训练的机器学习工具可以在标识哪些成像(和非成像)特征和图案及其对治疗的改变时非常有效,是诊断、反应和/或疗效的最佳预测器并且用作知识发现工具。针对个性化肿瘤治疗,癌症正被以日益精细的尺度分类。例如,图像特征、临床数据、病史和/或基因测定用于唯一地标识肿瘤表型。在此类情形下,每一癌症变成唯一疾病。针对每个表型来训练机器学习分类器需要针对每个表型访问许多示例。由于精细尺度,来自实际的患者的此类数据可能在足够数量方面不可用和/或可能难以获取。结果,获取必要量的数据以在没有数据扩增的情况下训练复杂的放射组学(radiomics)或放射基因组学(radiogenomics)机器学习系统变得极有挑战性。合成示例可以用于扩增训练数据库。特征检测和学习范例基于使用肿瘤表型的多尺度模型而不是从图像的合成示例开始所创建的合成样本。目的旨在不仅检测微妙表型图案,而且基于较低尺度生理和/或分子信息使它们与更接近于给定分子或细胞水平模型的已知根本原因相关。为了应付用于训练的有限量的可用标记数据,肿瘤生长的多尺度模型与成像模型耦合来为机器学习创建合成图像。图1示出了用于训练机器学习分类器以输出肿瘤表型信息的方法的一个实施例。训练数据被扩增。训练数据包括肿瘤的图像的示例和已标记的地面真值(groundtruth)或疗效(例如,表型信息)。肿瘤模型接收参数的各组值以生成示例肿瘤。样本数据点使用肿瘤的模型来针对肿瘤中的差异反映图像中的表观改变。合成成像引擎接收图像参数、示例肿瘤、系统变化性(例如,来自成像的模型化噪声)和/或实现成像的模拟的其他患者数据。合成成像引擎按疗效创建示例图像作为模型驱动训练数据的数据库。其中不仅已经发现的知识被表示而且来自患者人口、图像形成和总系统噪声的变化性被结合的知识驱动数据集被创建。可以提供具有不同的、附加的或更少的动作的其他方法。在一个实施例中,其中虚拟肿瘤具有已知细胞和组织特性的图像的扩增合成数据库被创建。数据库的每个图像是通过获取图像模板、选择器官、在所选择的器官内执行虚拟肿瘤建模以及生成虚拟癌症、按虚拟癌症创建合成图像并且将该合成图像添加到数据库来生成的。机器根据可利用真实患者数据补充的扩增合成数据库来训练放射组学或放射基因组学预测模型。放射组学或放射基因组学模型是用于使用早期阶段肿瘤模型的早期肿瘤诊断、主动监视的模型和/或用于虚拟活组织检查(biopsy)的模型。放射组学或放射基因组学模型被应用于看不见的图像数据以得到针对患者的诊断、监测和/或治疗计划。在一个方法中,合成样本基于较低尺度生理信息(例如,基于患者数据或一组基于人口的参数)使用肿瘤生理学(包括由于治疗而导致的生长、浸润、转移和/或萎缩)的模型来创建。例如,在高水平上,通过确立的研究,已经发现具有某些人口统计资料和基因排列的患者具有带特定水平的血管生成、低氧、肿瘤形状不规则的肿瘤生长的某种图案。此“模型”可以是用于为训练生成此表型的合成样本的基础,其中变化性被引入到诸如密度、位置和大小的肿瘤特性的这些和/或其他方面。疗效匹本文档来自技高网...
根据合成数据利用机器学习的基于图像的肿瘤表型分析

【技术保护点】
一种用于医学系统中的基于图像的肿瘤表型分析的方法,所述方法包括:获取表示患者的组织中的肿瘤的医学扫描数据;从所述医学扫描数据中提取一组特征;将所述特征输入到机器训练的分类器,所述机器训练的分类器至少部分地根据不特定于针对现有患者案例的训练数据的合成地生成的图像并且基于肿瘤模型被训练;通过将所述机器训练的分类器应用于所述特征来确定所述肿瘤的表型信息;以及输出所述表型信息。

【技术特征摘要】
2016.06.09 US 62/347864;2017.05.02 US 15/5843931.一种用于医学系统中的基于图像的肿瘤表型分析的方法,所述方法包括:获取表示患者的组织中的肿瘤的医学扫描数据;从所述医学扫描数据中提取一组特征;将所述特征输入到机器训练的分类器,所述机器训练的分类器至少部分地根据不特定于针对现有患者案例的训练数据的合成地生成的图像并且基于肿瘤模型被训练;通过将所述机器训练的分类器应用于所述特征来确定所述肿瘤的表型信息;以及输出所述表型信息。2.根据权利要求1所述的方法,其中,获取包括获取计算机断层扫描数据、磁共振数据或分子成像数据。3.根据权利要求1所述的方法,还包括获得所述患者的其他数据,所述其他数据包括症状、患者人口统计资料、血液生物标志物、病史、非侵入性测量结果,从临床报告、基因学或其组合中提取,其中,输入包括输入所述其他数据,并且其中,确定包括通过将所述机器训练的分类器应用于所述特征和其他数据来确定。4.根据权利要求1所述的方法,其中,所述机器训练的分类器包括深度学习分类器,并且其中,提取包括提取该组特征作为所述确定的在所述应用将所述特征输入到所述机器训练的分类器的后续层的情况下的一部分。5.根据权利要求1所述的方法,其中,确定包括利用所述机器训练的分类器的应用来确定,其中所述机器训练的分类器至少部分地根据所述合成地生成的图像被训练,其中所述合成地生成的图像是一个或多个扫描模态的模型与所述肿瘤模型的组合。6.根据权利要求1所述的方法,其中,确定包括利用所述机器训练的分类器来确定,其中所述机器训练的分类器至少部分地根据所述合成地生成的图像被训练,其中所述合成地生成的图像使用肿瘤生理学的多尺度模型作为所述肿瘤模型来生成,所述多尺度模型包括分子、细胞和组织尺度。7.根据权利要求1所述的方法,其中,确定包括利用所述机器训练的分类器的应用来确定,其中所述机器训练的分类器至少部分地根据所述合成地生成的图像被训练,其中所述合成地生成的图像从所述肿瘤模型的扰动生成。8.根据权利要求1所述的方法,其中,确定包括利用所述机器训练的分类器的应用来确定,其中所述机器训练的...

【专利技术属性】
技术研发人员:D科马尼丘A卡门刘大元B马耶T曼西
申请(专利权)人:西门子保健有限责任公司
类型:发明
国别省市:德国,DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1