【技术实现步骤摘要】
本专利技术属于生物信息学领域领域,具体涉及一种基因表达评分算法、肿瘤诊断模型及构建方法。
技术介绍
1、随着基因测序技术和蛋白质组检测技术的发展,各式各样的研究产生了大量的数据集,涵盖了许多基因表达数据,包括dna、信使rna(messenger rna,mrna)、微小rna(microrna,mirna)、小核rna(small nuclearrna,snrna)、环状rna(circular rna,circrna)、长非编码rna(long non-coding rna,lncrna)、小核仁rna(small nucleolarrna,snorna)、蛋白质等。不同数据集中的基因表达数据,其样本来源、物种/人种、实验操作、检测方法、仪器平台等均不一致。因此,不同的数据集的基因表达数据,往往无法直接整合。尽管存在一些数据整合算法(例如,combat-seq[1]、sva[2]、ratio-g[3]等),但它们往往无法有效消除数据集之间的差异效应(包括检测平台、方法、基因、操作和数据格式的差异)。
2、肝癌是全球范围内
...【技术保护点】
1.一种基因表达评分算法,其特征在于,包括以下步骤:
2.如权利要求1所述的基因表达评分算法,其特征在于,所述步骤S1中的基因表达数据的预处理,可以是原始数据(raw data),或标准化(normalization)处理后的数据,或者进过log2或log10处理的数据。
3.如权利要求1所述的基因表达评分算法,其特征在于,所述分位数按照整体数据2至100分类单元分位计算(即2至100分位),对每个样本每个基因的原始表达进行排序;优选按照十分位数,将赋予每个样本每个基因1-10的评分(即相对表达值)。
4.如权利要求1所述的基因表达
...【技术特征摘要】
1.一种基因表达评分算法,其特征在于,包括以下步骤:
2.如权利要求1所述的基因表达评分算法,其特征在于,所述步骤s1中的基因表达数据的预处理,可以是原始数据(raw data),或标准化(normalization)处理后的数据,或者进过log2或log10处理的数据。
3.如权利要求1所述的基因表达评分算法,其特征在于,所述分位数按照整体数据2至100分类单元分位计算(即2至100分位),对每个样本每个基因的原始表达进行排序;优选按照十分位数,将赋予每个样本每个基因1-10的评分(即相对表达值)。
4.如权利要求1所述的基因表达评分算法,其特征在于,所述步骤s1中收集的数据集包括dna、信使rna、微小rna、小核rna、环状rna、长非编码rna、小核仁rna、蛋白质中的至少一种。
5.一种肿瘤诊断模型,...
【专利技术属性】
技术研发人员:潘星华,苏焕厚,
申请(专利权)人:广州处方基因技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。