【技术实现步骤摘要】
【国外来华专利技术】基于机器学习的医学数据检查器
[0001]相关专利申请的交叉引用本申请要求 2020 年 6 月 24 日提交的美国临时专利申请第 63/043,691 号的优先权权益,出于所有目的通过引用将其并入。
技术介绍
[0002]医疗服务提供者每天为不同的受试者(例如,患者)创建大量的医学数据。每个受试者的医学数据可以包括多模态医学数据。例如,对于癌症患者,多模态医学数据可以包括受试者的生平数据、受试者的组织样本的医学图像、组织样本的分析信息、受试者的突变状态等。多模态医学数据可以存储在一个或多个数据库中。临床医生可以从数据库中获取受试者的多模态医学数据,基于医学数据进行诊断并为受试者确定治疗计划以及治疗的预后。例如,基于肿瘤大小,临床医生可以确定受试者所处的癌症的阶段,并决定受试者应该接受的治疗形式(例如,化学疗法、放射疗法或手术)以延长受试者的存活期。此外,临床医生可以在确定治疗时考虑受试者的突变状态。例如,对于某些类型的疗法,一些携带某些基因中的突变的受试者可能比不携带这些突变的受试者更有反应,这可以帮助临床医生决定受试者的治疗方法。
[0003]多模态医学数据通常从多个数据源汇集而来,并由不同的医疗服务提供者准备。例如,医学图像可以由医学成像部门准备,而生平数据可以由接收部门准备。这种安排可能容易出错。例如,可能将身份识别错误引入到多模态医学数据,在这种情况下,特定患者的部分或全部医学数据被换成另一患者的医学数据。身份识别错误的一个示例是样本出处复杂化(也称为错误归属),其中一名患者的一条数据已经被换成了另一患者的数据。识别 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种方法,其包括:访问受试者的多模态医学数据,所述多模态医学数据包括样本载玻片的医学图像,其中所述样本载玻片中的样本是从所述受试者收集的;基于所述医学图像生成与所述医学图像的生物学属性有关的预测;确定所述医学图像的所述生物学属性与所述多模态医学数据的其他模态之间的一致性程度;以及基于所述一致性程度输出对所述多模态医学数据是否包含不一致性的指示。2. 根据权利要求 1 所述的方法,其中所述生物学属性与一个或多个生物学属性类型相关联,所述一个或多个生物学属性类型包括以下中的至少一者:所述样本的源器官、所述样本的提取方法、所述样本的蛋白质表达或所述样本中肿瘤细胞的类型。3. 根据权利要求 1 或 2 所述的方法,其进一步包括:定义图块集,其中所述图块集中的每一个图块包括所述医学图像的不同部分;针对所述图块集中的每一个图块,生成与所述图块的生物学属性有关的图块级预测,其中与所述医学图像的所述生物学属性有关的所述预测是基于聚合对所述图块集的所述图块级预测所生成的。4. 根据权利要求 3 所述的方法,其中所述图块集的所述图块级预测包括对针对所述图块集的第一子集的第一生物学属性以及针对所述图块集的第二子集的第二生物学属性的图块级预测;并且其中基于聚合所述图块级预测生成与所述医学图像的所述生物学属性有关的所述预测包括:确定所述图块集的所述第一子集中图块的第一数量;确定所述图块集的所述第二子集中图块的第二数量;以及基于所述第一数量大于所述第二数量,选择所述第一生物学属性作为所述医学图像的所述生物学属性。5. 根据权利要求 4 所述的方法,其中所述图块集的所述第二子集中的每一个图块与缩放因子相关联;并且其中所述第二数量是基于所述图块集的所述第二子集中所述图块的计数和所述缩放因子确定的。6. 根据权利要求 5 所述的方法,其中所述图块的所述缩放因子是基于以下中的至少一者:对针对所述图块的所述第二生物学属性的所述图块级预测的置信水平或相关程度。7. 根据权利要求 6 所述的方法,其中针对所述图块集中的每一个图块,生成与所述图块的所述生物学属性有关的所述图块级预测包括:针对每一个图块,生成所述图块具有针对候选生物学属性集中的每一个候选生物学属性的候选生物学属性的可能性;以及从所述候选生物学属性集中选择具有最高可能性的候选生物学属性;并且其中对针对每一个图块的所述图块级预测的所述置信水平是基于针对所述图块所选择的候选生物学属性的第一可能性值与针对所述图块未选择的另一候选生物学属性的第二可能性值之间的差异。
8. 根据权利要求 6 或 7 所述的方法,其中所述相关程度是基于所述图块的位置。9. 根据权利要求 3 至 8 中任一项所述的方法,其中所述图块级预测是使用机器学习模型生成的,所述机器学习模型包括卷积神经网络和完全连接的网络;其中所述卷积神经网络基于图块的像素数据的块来生成卷积输出集;并且其中所述完全连接的网络基于所述卷积输出集将所述图块分类为候选生物学属性集中的一个候选生物学属性。10. 根据权利要求 1 至 9 中任一项所述的方法,其中所述指示被输出到呈现所述多模态医学数据的医学应用程序。11.一种计算机产品,其包括存储多个指令的计算机可读介质,所述多个指令用于控制计算机系统以进行以上方法中的任何方法的操作。12. 一种系统,其包括:根据权利要求 11 所述的计算机产品;以及一个或多个处理器,其用于执行存储在所述计算机可读介质上的指令。13.一种系统,其包括用于进行以上方法中的任何方法的装置。14.一种系统,其经配置为进行以上方法中的任何方法。15.一种系统,其包括分别进行以上方法中的任何方法的步骤的模块。16.一种方法,其包括:访问样本载玻片的医学图像,其中所述样本载玻片中的样本是从受试者收集的,所述医学图像是所述受试者的多模态医学数据的一部分;定义图块集,其中所述图块集中的每一个图块包括所述医学图像的不同部分;针对所述图块集中的每一个图块,生成所述图块的图块级表示;针对所述图块集中的每一个图块,基于所述图块的所述图块级表示将所述图块分配到集群集中的特定集群;基于图块分配,确定跨所述集群集的集群分配的分布;以及基于所述分布,生成所述医学图像的载玻片级表示;以及基于所述载玻片级表示,生成与所述医学图像的生物学属性有关的预测。17. 根据权利要求 16 所述的方法,其中所述生物学属性与一个或多个生物学属性类型相关联,所述一个或多个生物学属性类型包括以下中的至少一者:所述样本的源器官、所述样本的提取方法、所述样本的蛋白质表达或肿瘤...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。