【技术实现步骤摘要】
本专利技术涉及一种生物体的状态和基因表达量和/或细胞内物质的量的多变量解析处理和可以以此为基础的测定机械材料、检验方法等。
技术介绍
自2000年6月发布的人类基因组的解读宣言以来,可以说已经跨入了阐明基因组中所写的遗传信息如何发现、并起着怎样的作用的后基因组时代。在人类基因组计划的进展中,也发展了测定基因组表达状态的方法论。已知转录组(mRNA)的测定方法有寡核苷酸阵列及微型芯片。另外在蛋白质组(蛋白质)测定方法中,在以前的2维电泳基础上,最近发展了质量分析的方法。抗体芯片等先进的技术也正受到人们的关注。与迄今为止的在短时间内可很快测定生物体的状态参数的技术相比较,可以说这些测定技术是具有划时代意义的。有效测定基因表达状态的技术例如有如下几种。已知指定转录组(mRNA的总体)的技术是在基底装载多种DNA,检测与其互补的mRNA的DNA芯片。在代表性的DNA芯片中存在基因芯片和DNA微阵列。另外,在测定蛋白质组(蛋白质的总体)的过程中有使用2维电泳、抗体芯片、质谱技术的。另外,尝试利用质量分析等测定代谢物组(包含代谢中间体的代谢产物的总体)的方法也得到了发展。为了通过基因产物的测定更好地描述生物体内的细胞状态,即使在现在这样诊断标记物信息不足的情况下,人们依然期待着可以更高精度地进行诊断。例如有如下的研究工作。P.O.Brown等利用DNA芯片测定淋巴肿瘤患者的细胞中的转录组,通过群集分析将恶性和良性的淋巴肿瘤(DLBCL)分成特定群集(Nature 403(3),503-11(2000))。但是,这不是一种获得因果关系(相关关系)的模型,不能判断某个 ...
【技术保护点】
一种数据解析装置,该装置确定以生物体的状态或随时间概率性发生的生物体的状态变化为目的变量,以多个基因表达量和/或细胞内物质的量为说明变量的相关模型,其特征在于,该数据解析装置包括:输入装置和确定装置,其中输入装置输入生物体的状态或导 出该状态的数据或者随时间概率性发生的与生物体的状态变化相关的数据,和由多个基因表达量和/或细胞内物质的量构成的样品的集合;确定装置,该装置包括:(1)选择说明变量的选择装置,(2)执行部分最小二乘法,计算交互验证成绩的计算装置,或者将前述生物体的状态变化相关的数据应用Kaplan-Meier法或Cutler-Ederer法所依据的生命表,计算不发生变化的数据的概率,使得到的概率进行假定分布条件下的变换或者没有假定前提的条件下的变换,以该变换结果作为目的变量,执行部分最小二乘法,从而计算交互验证成绩的计算装置,(3)评价上述(2)的计算装置的结果,判断说明变量的采用、不采用的评价判断装置,并且,(4)执行前述(1)的选择装置和前述(2)的计算装置和前述(3)的评价判断装置,不断改善以部分最小二乘法模型的至少交互验证成绩为独立变量的函数,确定部分 ...
【技术特征摘要】
JP 2002-4-4 102743/2002;JP 2002-12-4 352645/20021.一种数据解析装置,该装置确定以生物体的状态或随时间概率性发生的生物体的状态变化为目的变量,以多个基因表达量和/或细胞内物质的量为说明变量的相关模型,其特征在于,该数据解析装置包括输入装置和确定装置,其中输入装置输入生物体的状态或导出该状态的数据或者随时间概率性发生的与生物体的状态变化相关的数据,和由多个基因表达量和/或细胞内物质的量构成的样品的集合;确定装置,该装置包括(1)选择说明变量的选择装置,(2)执行部分最小二乘法,计算交互验证成绩的计算装置,或者将前述生物体的状态变化相关的数据应用Kaplan-Meier法或Cutler-Ederer法所依据的生命表,计算不发生变化的数据的概率,使得到的概率进行假定分布条件下的变换或者没有假定前提的条件下的变换,以该变换结果作为目的变量,执行部分最小二乘法,从而计算交互验证成绩的计算装置,(3)评价上述(2)的计算装置的结果,判断说明变量的采用、不采用的评价判断装置,并且,(4)执行前述(1)的选择装置和前述(2)的计算装置和前述(3)的评价判断装置,不断改善以部分最小二乘法模型的至少交互验证成绩为独立变量的函数,确定部分最小二乘法模型。2.如权利要求1所述的数据解析装置,其特征在于,目的变量为生物体的状态,利用前述输入装置输入的数据是生物体的状态或导出该状态的数据,前述(2)的计算装置是执行部分最小二乘法计算交互验证成绩的计算装置。3.如权利要求1所述的数据解析装置,其特征在于,目的变量是随时间概率性发生的生物体的状态变化,利用前述输入装置输入的数据是随时间概率性发生的生物体状态变化相关的数据,前述(2)的计算装置是将前述生物体的状态变化相关数据应用Kaplan-Meier法或Cutler-Ederer法所依据的生命表,计算不发生变化的数据的概率,使得到的概率进行假定分布条件下的变换或者未假定前提的条件下的变换,以该变换结果作为目的变量,执行部分最小二乘法,从而计算交互验证成绩的计算装置。4.如权利要求1、2或3的任一项所述的数据解析装置,其特征在于,设有最终模型确定装置,该装置使用在由前述确定装置确定的部分最小二乘法模型中采用的说明变量或该模型的潜在变量,构建统计学方法或多变量解析方法依据的模型。5.如权利要求1~4任何一项所述的数据解析装置,其特征在于,在前述选择装置中逐次取舍选择说明变量。6.如权利要求1~4任何一项所述的数据解析装置,其特征在于,在前述选择装置中使用遗传性运算法则选择说明变量。7.如权利要求1~6任何一项所述的数据解析装置,其特征在于,在前述计算装置中逐次排除1个样品,执行部分最小二乘法,计算交互验证成绩。8.如权利要求1~6任何一项所述的数据解析装置,其特征在于,在前述计算装置中逐次排除多个样品,执行部分最小二乘法,计算交互验证成绩。9.如权利要求7或8所述的数据解析装置,其特征在于,在前述计算装置中,求得表示由各计算中排除的基因表达预测的生物体状态的目的变量值,和显示前述排除的样品的生物体状态的目的变量值相关的误差的代表值,使用该误差作为交互验证成绩的指标。10.如权利要求1~9任何一项所述的数据解析装置,其特征在于,前述函数为交互验证成绩。11.如权利要求1~9任何一项所述的数据解析装置,其特征在于,所述函数是交叉验证成绩与选择的说明变量个数相关的函数。12.如权利要求5所述的数据解析装置,其特征在于,在前述确定装置中,在改善至少具有交互验证成绩为独立变量的函数的同时,反复进行评价判定。13.如权利要求1~12任何一项所述的数据解析装置,其特征在于,用多个计算机执行所述(1)的选择装置和前述(2)的计算装置。14.一种数据解析装置,其特征在于,该装置由对权利要求1、2、3和4确定的相关模型和预测对象的样品输入该模型中所采用的说明变量的输入装置,和根据输入的该说明变量预测判断该样品的生物体的状态的预测判断装置构成。15.如权利要求2所述的数据解析装置,其中,设置用名义尺度、顺序尺度或连续量表现生物体状态的目的变量。16.如权利要求2或4所述的数据解析装置,其特征在于,最终模型确定装置使用的前述统计学方法或多变量解析方法,是比例风险法或融入参数的分布中的回归分析法。17.一种数据解析方法,该方法确定以生物体的状态或随时间概率性发生的生物体状态变化为目的变量,以多个基因表达量和/或细胞内物质的量为说明变量的相关模型,其特征在于,包括输入步骤,该输入步骤输入生物体的状态或导出该状态的数据或者随时间概率性发生的与生物体状态变化相关的数据,和由多个基因表达量和/或细胞内物质的量构成的样品的集合;和(1)选择说明变量的选择步骤;(2)执行部分最小二乘法,计算交互验证成绩的计算步骤,或者将前述生物体的状态变化相关的数据应用Kaplan-Meier法或Cutler-Ederer法所依据的生命表,计算不发生变化的数据的概率,使得到的概率进行假定分布条件下的变换或者未假定前提的条件下的变换,以该变换结果作为目的变量,执行部分最小二乘法,从而计算交互验证成绩的计算步骤;(3)评价前述(2)的计算步骤的结果,判断说明变量的采用、不采用的评价判断步骤;和(4)执行前述(1)的选择步骤和前述(2)的计算步骤和前述(3)的评价判断步骤,不断改善以部分最小二乘法模型的具有至少交互验证成绩为独立变量的函数,确定部分最小二乘法模型的确定步骤。18.如权利要求17所述的数据解析方法,其特征在于,目的变量为生物体的状态,利用前述输入步骤输入的数据是生物体的状态或导出其状态的数据,前述(2)的计算步骤是执行部分最小二乘法计算交互验证成绩的计算步骤。19.如权利要求17所述的数据解析方法,其特征在于,目的变量是随时间概率性发生的生物体状态变化,利用前述输入步骤输入的数据是随时间概率性发生的生物体状态变化相关的数据,前述(2)的计算步骤是将前述生物体状态变化相关的数据应用Kaplan-Meier法或Cutler-Ederer法所依据的生命表,计算不发生变化的数据的概率,使得到的概率进行在假定分布条件下的变换或者未假定前提的条件下的变换,以该变换结果作为目的变量,执行部分最小二乘法,从而计算交互验证成绩的计算步骤。20.如权利要求17、18或19所述的数据解析方法,其特征在于,设有最终模型确定步骤,使用在由前述确定步骤确定的部分最小二乘法模型中采用的说明变量或该模型的潜在变量,构建统计学方法或多变量解析方法依据的模型。21.如权利要求17~20任何一项所述的数据解析方法,其特征在于,在前述选择步骤中逐次取舍选择说明变量。22.如权利要求17~22任何一项所述的数据解析方法,其特征在于,在前述选择步骤中使用遗传性运算法则选择说明变量。23.如权利要求1~6任何一项所述的数据解析方法,其特征在于,在前述计算步骤中逐次排除1个样品,执行部分最小二乘法,计算交互验证成绩。24.如权利要求17~22任何一项所述的数据解析方法,其特征在于,在前述计算步骤中逐次排除多个样品,执行部分最小二乘法,计算交互验证成绩。25.如权利要求23或24所述的数据解析方法,其特征在于,在前述计算步骤中求得表示由各计算中排除的基因表达预测的生物体状态的目的变量值,与显示前述排除的样品的生物体状态的目的变量值的误差的代表值,使用该误差作为交互验证成绩的指标。26.如权利要求17~25任何一项所述的数据解析方法,其特征在于前述函数为交互验证成绩。27.如权利要求17~25任何一项所述的数据解析方法,其特征在于,所述函数是交互验证成绩与选择的说明变量个数的函数。28.如权利要求21所述的数据解析方法,其特征在于,在前述确定步骤中,在改善至少具有交互验证成绩为独立变量的函数的同时反复进行评价判定。29.如权利要求17~28任何一项所述的数据解析方法,其特征在于,用多个计算机执行所述(1)的选择步骤和前述(2)的计算步骤。30.一种数据解析方法,其特征在于,该方法由...
【专利技术属性】
技术研发人员:石川俊夫,久米隆志,
申请(专利权)人:石原产业株式会社,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。