【技术实现步骤摘要】
【国外来华专利技术】异常值显著性评价的系统和方法相关申请的交叉引用本申请要求2016年11月3日提交的美国临时专利申请第62/417,149号的优先权,其全部内容通过引用并入本文中。
本公开的系统和方法涉及异常值识别。更具体地,本公开的系统和方法涉及在包含样本的分析中确定连续值观测结果的因子显著性的改进方法,所述样本包括与因子对应的观测数据。
技术介绍
异常值分析可以确定在基因表达观测数据中的异常值。然而,目前的异常值分析在不同的分析仪之间或不同的输入参数下不能直接比较。这限制了在荟萃分析(meta-analysis)中整合分析的结果。另外,目前荟萃分析的方法可能需要大量分析,并且可能无法根据不同规模的分析调整结果。因此存在改进的空间。
技术实现思路
识别多个样本中具有异常表达基因的检测系统,可以包括:至少一个处理器、以及包含指令的至少一个非暂时性计算机可读介质。当所述指令通过所述至少一个处理器执行时,引起所述至少一个处理器执行操作,所述操作包括:接收多个样本的基因表达数据,所述样本包括对应于基因的基因表达值;使用每个基因的中位数和绝对中位差标准化所述基因表达数据;基于异常基因表达数据的 ...
【技术保护点】
1.识别多个样本中具有异常表达基因的检测系统,包括:至少一个处理器,以及包含指令的至少一个非暂时性计算机可读介质,当所述指令通过所述至少一个处理器执行时,引起所述至少一个处理器执行操作,所述操作包括:接收多个样本的基因表达数据,所述样本包括对应于基因的基因表达值;使用每个基因的中位数和绝对中位差标准化所述基因表达数据;基于异常基因表达数据的概率确定标准化的基因表达观测结果的分布统计值;使用标准化的基因表达数据确定所述分布统计的零分布;以及输出所述多个样本中所述基因的显著性值,所述显著性值基于所述分布统计和所述零分布的值。
【技术特征摘要】
【国外来华专利技术】2016.11.03 US 62/417,1491.识别多个样本中具有异常表达基因的检测系统,包括:至少一个处理器,以及包含指令的至少一个非暂时性计算机可读介质,当所述指令通过所述至少一个处理器执行时,引起所述至少一个处理器执行操作,所述操作包括:接收多个样本的基因表达数据,所述样本包括对应于基因的基因表达值;使用每个基因的中位数和绝对中位差标准化所述基因表达数据;基于异常基因表达数据的概率确定标准化的基因表达观测结果的分布统计值;使用标准化的基因表达数据确定所述分布统计的零分布;以及输出所述多个样本中所述基因的显著性值,所述显著性值基于所述分布统计和所述零分布的值。2.如权利要求1所述的检测系统,其中确定所述分布统计值包含:自助重抽样,所述自助重抽样包括执行重排所述基因表达数据的随机迭代,所述基因表达数据生成每个基因新分配的基因表达值,其中所述异常基因表达数据的概率根据观测的和随机的基因表达值计算。3.如权利要求2所述的检测系统,其中随机选择的观测结果从标准化的观测数据中随机可置换选择。4.如权利要求2所述的检测系统,其中所述自助重抽样包括随机基因表达值的所有可能组合的随机迭代。5.如权利要求1所述的检测系统,其中所述分布统计包括分位数。6.如权利要求1所述的检测系统,其中确定所述分布统计值包括:通过随机化所述标准化的基因表达数据的所有可能随机迭代的一部分生成基因的自助值,以及将函数拟合至所述自助值的至少一部分以估计所述基因的所述零分布的尾部,所述尾部包括显著性值的异常值数据,其中所述异常基因表达数据的概率根据估计的尾部计算。7.如权利要求6所述的检测系统,其中所述函数为通过比例参数和形状参数的至少一个参数化的连续概率分布。8.如权利要求6所述的检测系统,其中所述函数为广义帕累托分布。9.如权利要求1所述的检测系统,其中所述操作还包括接收基因额外显著性值,以及基于接收的所述基因额外显著性值和所述基因的显著性值,输出所述基因修正的显著性值。10.如权利...
【专利技术属性】
技术研发人员:山姆·吴,洪·高,亨德里库斯·贾斯珀·格尔曼,
申请(专利权)人:伊路米纳有限公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。