用于分析物水平的自适应归一化的方法、装置和计算机可读介质制造方法及图纸

技术编号：33702146 阅读：15 留言：0更新日期：2022-06-06 08:14

一种用于一个或多个样品中的分析物水平的自适应归一化的方法、装置和计算机可读介质，所述方法包括：接收对应于在所述一个或多个样品中检测到的一种或多种分析物的一种或多种分析物水平；以及通过一次或多次迭代来迭代地将比例因子应用于所述一种或多种分析物水平，直到连续迭代之间的所述比例因子的变化小于或等于预定变化阈值或者直到所述一次或多次迭代的量超过最大迭代值；至少部分地基于在其对应参考分布的预定距离内的分析物水平来确定所述比例因子；以及通过应用所述比例因子来归一化所述一种或多种分析物水平。子来归一化所述一种或多种分析物水平。子来归一化所述一种或多种分析物水平。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于分析物水平的自适应归一化的方法、装置和计算机可读介质
[0001]相关申请的交叉引用
[0002]本申请要求于2019年7月31日提交的美国临时申请号62/880,791的优先权，其全部内容通过引用并入本文。

技术介绍

[0003]开发中值归一化是为了在分析之前从数据集中去除某些测定伪影。这种归一化可去除样品或测定偏差，所述样品或测定偏差可能是由于样品之间总蛋白质浓度的差异(例如，由于水合状态)、移液误差、试剂浓度的变化、测定时间和单次测定中系统可变性的其他来源造成的。另外，已观察到蛋白质组测定(例如，基于适体的蛋白质组测定)可产生相关噪声，并且归一化过程在很大程度上减轻了这些人为的相关性。
[0004]中值归一化依赖于真正的生物标志物(与潜在生理学相关)相对罕见的概念，因此高度多重蛋白质组测定中的大多数蛋白质测量在感兴趣的群体中没有变化。因此，可以认为样品内和感兴趣群体中的大多数蛋白质测量是从具有明确定义的中心和比例的分析物的普通群体分布中取样的。当这些假设不成立时，中值归一化可能将伪影引入数据中，使真实的生物信号静默并且将系统性差异引入在样品集内没有差异表达的分析物中。
[0005]已观察到与样品收集和处理相关的某些预分析变量违反了中值归一化的假设，因为大量分析物可能会受到样品旋转不足或在从大量流体中分离之前允许细胞裂解的影响。此外，来自患有慢性肾脏疾病的患者的蛋白质测量已显示数百种蛋白质水平受此状况影响，导致与肾脏功能正常的人相比，这些人的循环蛋白质浓度增加。
[0006]因此，需要对系统进行...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种由一个或多个计算设备执行的用于一个或多个样品中的分析物水平的自适应归一化的方法，所述方法包括：由所述一个或多个计算设备中的至少一个计算设备接收对应于在所述一个或多个样品中检测到的一种或多种分析物的一种或多种分析物水平，每种分析物水平对应于在所述一个或多个样品中检测到的所述分析物的量；以及通过一次或多次迭代来归一化所述一种或多种分析物水平，对于每次迭代，去除所述一种或多种分析物水平中的任何异常分析物水平，至少部分地基于一种或多种分析物水平中的至少一种剩余分析物水平来计算比例因子，并将比例因子应用于所述一种或多种分析物水平；其中所述一种或多种分析物水平中的异常分析物水平至少部分地基于每种分析物水平与参考数据集中该分析物的对应参考分布之间的异常分析来确定。2.根据权利要求1所述的方法，其中所述异常分析包括基于距离的异常分析。3.根据权利要求1所述的方法，其中所述异常分析包括基于密度的异常分析。4.根据权利要求1
‑
3中任一项所述的方法，其中在一次或多次迭代中归一化所述一种或多种分析物水平包括执行额外的迭代，直到连续迭代之间的所述比例因子的变化小于或等于预定变化阈值，或直到所述一次或多次迭代的量超过最大迭代值。5.一种用于对一个或多个样品中的分析物水平进行自适应归一化的计算机执行方法，所述方法包括：接收对应于在所述一个或多个样品中检测到的一种或多种分析物的一种或多种分析物水平，每种分析物水平对应于在所述一个或多个样品中检测到的所述分析物的量；以及通过一次或多次迭代来迭代地将比例因子应用于所述一种或多种分析物水平，直到连续迭代之间的所述比例因子的变化小于或等于预定变化阈值，或者直到所述一次或多次迭代的量超过最大迭代值，所述一次或多次迭代中的每次迭代包括：确定所述一种或多种分析物水平中的每种分析物水平和参考数据集中该分析物的对应参考分布之间的距离；至少部分地基于在其对应参考分布的预定距离内的分析物水平来确定所述比例因子；以及通过应用所述比例因子来归一化所述一种或多种分析物水平。6.根据权利要求5所述的方法，其中，确定所述一种或多种分析物水平中的每种分析物水平与参考数据集中该分析物的对应参考分布之间的距离包括：确定每种分析物水平与所述参考数据集中该分析物的对应参考分布之间的马氏距离的绝对值。7.根据权利要求5所述的方法，其中，确定所述一种或多种分析物水平中的每种分析物水平与参考数据集中该分析物的对应参考分布之间的距离包括：确定每种分析物水平与所述参考数据集中该分析物的对应参考分布的平均值或中值之间的标准偏差量。8.根据权利要求5
‑
7中任一项所述的方法，其中，所述预定距离包括在0.5至6范围内的值，包括端点值。9.根据权利要求5
‑
8中任一项所述的方法，其中，所述预定距离包括在1至4范围内的
值，包括端点值。10.根据权利要求5
‑
9中任一项所述的方法，其中，所述预定距离包括在1.5至3.5范围内的值，包括端点值。11.根据权利要求5
‑
10中任一项所述的方法，其中，所述预定距离包括在1.5至2.5范围内的值，包括端点值。12.根据权利要求5
‑
11中任一项所述的方法，其中，所述预定距离包括在2.0至2.5范围内的值，包括端点值。13.根据权利要求5
‑
12中任一项所述的方法，其中，至少部分地基于在其对应参考分布的预定距离内的分析物水平来确定所述比例因子包括：确定在所述对应参考分布的预定距离内的每种分析物水平的分析物比例因子，所述分析物比例因子是至少部分基于所述分析物水平和所述对应参考分布的平均值或中值而确定；通过计算对应于分析物水平的分析物比例因子的平均值或中值来确定所述比例因子，所述分析物水平在其对应的参考分布的预定距离内。14.根据权利要求5
‑
12中任一项所述的方法，其中，至少部分地基于在其对应参考分布的预定距离内的分析物水平来确定所述比例因子包括：确定使在其对应参考分布的预定距离内的分析物水平是其对应参考分布的...

【专利技术属性】
技术研发人员：E，
申请(专利权)人：细胞逻辑股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人