通过偏差校正和分类预测生成生物标记签名的系统和方法技术方案

技术编号：11974877 阅读：83 留言：0更新日期：2015-08-31 00:47

本文详述了用于按集成方式校正数据集并对数据集进行分类的系统和方法。训练数据集、训练分类集和测试数据集被接收。对于所述训练数据集，通过将机器学习技术应用到训练数据集和训练分类集来生成第一分类器，并且通过根据第一分类器对测试数据集中的元素进行分类来生成第一测试分类集。对于多次迭代中的每一次，训练数据集被变换，测试数据集被变换，并且通过将机器学习技术应用到经变换的训练数据集来生成第二分类器。根据第二分类器来生成第二测试分类集，并且将第一测试分类集与第二测试分类集相比较。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】本文详述了用于按集成方式校正数据集并对数据集进行分类的系统和方法。训练数据集、训练分类集和测试数据集被接收。对于所述训练数据集，通过将机器学习技术应用到训练数据集和训练分类集来生成第一分类器，并且通过根据第一分类器对测试数据集中的元素进行分类来生成第一测试分类集。对于多次迭代中的每一次，训练数据集被变换，测试数据集被变换，并且通过将机器学习技术应用到经变换的训练数据集来生成第二分类器。根据第二分类器来生成第二测试分类集，并且将第一测试分类集与第二测试分类集相比较。【专利说明】用于通过集成的偏差校正和分类预测生成生物标记签名的系统和方法相关申请的交叉引用本申请根据35U.S.C§ 119要求2012年6月21日递交的、题为"SYSTEMSAND METHODSFORGENERATINGBIOMARKERSIGNATURESWITHINTEGRATEDBIASCORRECTIONAND CLASSPREDICTION"的美国临时专利申请No. 61/662, 792的优先权，该美国临时专利申请被完整结合于此。
技术介绍
在生物医学领域，识别表明特定生物状态的物质即生物标记（biomarker)很重要。随着基因组学和蛋白质组学的新技术出现，生物标记对于生物发现、药品研发和健康护理正变得越来越重要。生物标记不仅对于很多疾病的诊断和预后有用，而且对于理解疗法的发展基础有用。生物标记的成功和有效识别可以加速新药品研发过程。通过疗法与诊断和预后的结合，生物标记识别还将增强当前医疗的质量，因而在药物遗传学、药物基因组学和药物蛋白质组学...

【技术保护点】
一种由处理器运行的将数据集分类到两个或更多个分类的计算机实现的方法，包括：(a)接收训练数据集和训练分类集，所述训练分类集标识与所述训练数据集中的每个元素相关联的分类；(b)接收测试数据集；(c)通过将机器学习技术应用到所述训练数据集和所述训练分类集来生成用于所述训练数据集的第一分类器；(d)通过根据所述第一分类器对所述测试数据集中的元素进行分类来生成第一测试分类集；(e)对于多次迭代中的每一次：(i)基于所述训练分类集和所述测试分类集中的至少一个来变换所述训练数据集；(ii)变换所述测试数据集；(iii)通过根据基于经变换的训练数据集和所述训练分类集的第二分类器对经变换的测试数据集中的元素进行分类来生成第二测试分类集；(iv)当所述第一测试分类集与所述第二测试分类集不同时，将所述第二分类集存储为所述第一分类集并将所述经变换的测试数据集存储为所述测试数据集并且返回步骤(i)。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：弗洛里安·马丁，向阳，
申请(专利权)人：菲利普莫里斯生产公司，弗洛里安·马丁，向阳，
类型：发明
国别省市：瑞士;CH

全部详细技术资料下载我是这个专利的主人