一种基因表达评分算法、肿瘤诊断模型及构建方法技术

技术编号:45408027 阅读:14 留言:0更新日期:2025-05-30 18:03
本发明专利技术属于生物信息学领域,具体涉及一种基因表达评分算法、肿瘤诊断模型及构建方法,本发明专利技术的算法旨在实现不同来源数据集的整合与标准化处理。与现有技术相比,本发明专利技术具有原理简单、使用方便、运行速度快等优点,并且可以消除不同数据集间的差异。在肿瘤研究领域,存在肿瘤间异质性高、单基因研究模式的片面化、测序数据难以整合等问题。因此,本发明专利技术也包括应用上述相对评分值算法,整合多个肿瘤数据集,并基于大量的肿瘤样本数据,构建出新型的肿瘤诊断模型的方法。该模型具有准确性高、数据易扩展、泛用性强的特点,并可用于发现潜在的肿瘤诊疗靶点。本发明专利技术基于肝癌数据集,证明了上述方案的可行性。

【技术实现步骤摘要】

本专利技术属于生物信息学领域领域,具体涉及一种基因表达评分算法、肿瘤诊断模型及构建方法


技术介绍

1、随着基因测序技术和蛋白质组检测技术的发展,各式各样的研究产生了大量的数据集,涵盖了许多基因表达数据,包括dna、信使rna(messenger rna,mrna)、微小rna(microrna,mirna)、小核rna(small nuclearrna,snrna)、环状rna(circular rna,circrna)、长非编码rna(long non-coding rna,lncrna)、小核仁rna(small nucleolarrna,snorna)、蛋白质等。不同数据集中的基因表达数据,其样本来源、物种/人种、实验操作、检测方法、仪器平台等均不一致。因此,不同的数据集的基因表达数据,往往无法直接整合。尽管存在一些数据整合算法(例如,combat-seq[1]、sva[2]、ratio-g[3]等),但它们往往无法有效消除数据集之间的差异效应(包括检测平台、方法、基因、操作和数据格式的差异)。

2、肝癌是全球范围内发病率和致死率较高的本文档来自技高网...

【技术保护点】

1.一种基因表达评分算法,其特征在于,包括以下步骤:

2.如权利要求1所述的基因表达评分算法,其特征在于,所述步骤S1中的基因表达数据的预处理,可以是原始数据(raw data),或标准化(normalization)处理后的数据,或者进过log2或log10处理的数据。

3.如权利要求1所述的基因表达评分算法,其特征在于,所述分位数按照整体数据2至100分类单元分位计算(即2至100分位),对每个样本每个基因的原始表达进行排序;优选按照十分位数,将赋予每个样本每个基因1-10的评分(即相对表达值)。

4.如权利要求1所述的基因表达评分算法,其特征在于...

【技术特征摘要】

1.一种基因表达评分算法,其特征在于,包括以下步骤:

2.如权利要求1所述的基因表达评分算法,其特征在于,所述步骤s1中的基因表达数据的预处理,可以是原始数据(raw data),或标准化(normalization)处理后的数据,或者进过log2或log10处理的数据。

3.如权利要求1所述的基因表达评分算法,其特征在于,所述分位数按照整体数据2至100分类单元分位计算(即2至100分位),对每个样本每个基因的原始表达进行排序;优选按照十分位数,将赋予每个样本每个基因1-10的评分(即相对表达值)。

4.如权利要求1所述的基因表达评分算法,其特征在于,所述步骤s1中收集的数据集包括dna、信使rna、微小rna、小核rna、环状rna、长非编码rna、小核仁rna、蛋白质中的至少一种。

5.一种肿瘤诊断模型,...

【专利技术属性】
技术研发人员:潘星华苏焕厚
申请(专利权)人:广州处方基因技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1