当前位置: 首页 > 专利查询>中山大学专利>正文

一种基于RNA编辑水平的乳腺癌分子标志物及诊断模型制造技术

技术编号:32126186 阅读:13 留言:0更新日期:2022-01-29 19:15
本发明专利技术提供了一种基于RNA编辑水平的乳腺癌分子标志物及诊断模型,属于分子生物医学技术领域。本发明专利技术的基于RNA编辑水平的乳腺癌分子标志物,以人类参考基因组hg19为基准,所述分子标志物包括以下RNA编辑位点:chr12:51324639:METTL7A、chr1:160966434:F11R、chr2:128951720:UGGT1、chr1:100489619:SLC35A3、chr12:69237519:MDM2、chr8:11700419:CTSB、chr4:177252238:SPCS3、chr1:179042905:FAM20B、chr1:168220280:TBX19和chr7:17384440:AHR。本发明专利技术基于上述RNA编辑位点,提出了一种基于随机森林算法构建的乳腺癌诊断模型,该模型鉴定乳腺癌的AUC值达到0.9858。相较于现有技术,本发明专利技术的诊断模型具有以下优点:(1)所需样品量少;(2)诊断结果稳定,准确性高,具有良好的临床使用和推广价值。具有良好的临床使用和推广价值。具有良好的临床使用和推广价值。

【技术实现步骤摘要】
一种基于RNA编辑水平的乳腺癌分子标志物及诊断模型


[0001]本专利技术属于分子生物医学
,具体涉及一种基于RNA编辑水平的乳腺癌分子标志物及诊断模型。

技术介绍

[0002]乳腺癌是发生在乳腺上皮组织的恶性肿瘤,在我国的发病率约为21.6/10万,是女性中最常见的癌症。分子诊断与分型技术已经成为乳腺癌检测的突破点,并取得了一系列进展。雌激素受体ER

α、孕激素受体PR、原癌基因HER

2以及血清标志物CA15

3/BR27.29已经作为预后因子用于分子诊断,此外,国外的70种基因表达谱检测以及21种基因检测分别被证明有能效预测乳腺癌的预后和复发。然而,乳腺癌的发病率和死亡率都呈现逐年上升的态势,说明现在的诊断和治疗技术还远远不能满足临床的需要,寻找新的用于乳腺癌诊断、预后以及监测的分子标志物,开发新的检测方法是乳腺癌分子诊断技术发展的瓶颈。
[0003]A

I(腺嘌呤到次黄嘌呤)RNA编辑是人类中最普遍的一种RNA编辑类型,RNA中的腺嘌呤核苷在RNA腺苷脱氨酶(ADAR)的催化下脱去氨基从而变成次黄嘌呤,由于次黄嘌呤(I)和胞嘧啶(C)进行配对,因此在细胞内被各种蛋白机器识别为鸟嘌呤(G)。近年来,A

I RNA编辑在癌症尤其是乳腺癌的发生中的重要作用已经引起了广泛关注。比如,在2015年,美国德州大学的MD Anderson癌症研究中心的Han Liang教授团队分析了TCGA(The Cancer Genome Atlas)项目中17种癌症共6236例癌症样品以及正常组织,发现RNA编辑的程度在大多数的癌症类型中都显著增高,值得注意的是在所有的17种癌症中,乳腺癌中共有5834个RNA编辑位点的编辑水平异常增高,是17种癌症中RNA编辑位点改变最多的。同时,该研究还发现了2057个RNA编辑位点在乳腺癌的不同的亚型中有显著差异。在乳腺癌中,这些发生异常的RNA编辑位点又在3

UTR区域显著富集。
[0004]Han Liang教授团队筛选出的在乳腺癌病人中异常增高的RNA编辑位点为乳腺癌的分子检测提供了分子标志物的候选,然而这些数量庞大的位点并非都是合适的分子标志物,目前尚未有有效的方法能够从庞大的候选位点中筛选出合适的用于乳腺癌分子检测的RNA编辑位点。

技术实现思路

[0005]针对上述问题,本专利技术的目的在于提供一种基于RNA编辑水平的乳腺癌分子标志物及诊断模型。
[0006]为实现上述目的,本专利技术采取的技术方案为:一种基于RNA编辑水平的乳腺癌分子标志物,以人类参考基因组hg19为基准,所述分子标志物包括以下RNA编辑位点:chr12:51324639:METTL7A、chr1:160966434:F11R、chr2:128951720:UGGT1、chr1:100489619:SLC35A3、chr12:69237519:MDM2、chr8:11700419:CTSB、chr4:177252238:SPCS3、chr1:179042905:FAM20B、chr1:168220280:TBX19和chr7:17384440:AHR。
[0007]作为本专利技术所述的乳腺癌分子标志物的优选实施方式,所述分子标志物的RNA编
辑位点的编辑水平在乳腺癌中异常增高。
[0008]本专利技术还提供上述分子标志物在制备检测乳腺癌的产品中的应用。
[0009]作为本专利技术所述的应用的优选实施方式,所述产品采用多重PCR方法或高通量测序的方法检测样本的RNA编辑位点的编辑水平。
[0010]本专利技术还提供一种基于RNA编辑水平的乳腺癌诊断模型的构建方法,包括以下步骤:
[0011](1)获取乳腺癌患者和正常组织样本的RNA编辑水平数据,得到每行为分析样本,每列为RNA编辑位点的编辑水平信息的二维矩阵;
[0012](2)剔除未检测到RNA编辑水平的位点;
[0013](3)根据特征重要性筛选候选RNA编辑位点;
[0014](4)将步骤(3)筛选出的RNA编辑位点作为特征,利用随机森林算法进行拟合,构建乳腺癌诊断模型。
[0015]在乳腺癌诊断模型在构建过程中,采用随机森林算法,具体建模参数为max_depth=50,ntree=200,nfolds=10,并采用AUC(Area Under Curve)作为预测效能的评价指标。
[0016]作为本专利技术所述的基于RNA编辑水平的乳腺癌诊断模型的构建方法的优选实施方式,所述步骤(2)的剔除的未检测到RNA编辑水平的位点为在20%及以上的样本中未检测到RNA编辑水平的位点。
[0017]作为本专利技术所述的基于RNA编辑水平的乳腺癌诊断模型的构建方法的优选实施方式,所述步骤(3)的筛选重要性RNA编辑位点,具体包括:
[0018](1)在步骤(2)保留下来的RNA编辑位点中,采用R软件包DMwR2的knnImputation函数进行缺失值的插补;
[0019](2)以样本类别(乳腺癌、正常)作为唯一标识,使用R软件包h2o的splitFrame函数随机选取2/3的样本作为训练集,剩下的1/3样本为验证集;
[0020](3)在训练集中,基于步骤(1)中插补后的所有RNA编辑位点,利用随机森林算法建模,以评价每个特征的重要性;
[0021](4)使用R软件包h2o的varimp函数获取每个RNA编辑位点对于乳腺癌检测的重要性;
[0022](5)筛选重要性高于0.01的RNA编辑位点。
[0023]在本专利技术的基于RNA编辑水平的乳腺癌诊断模型的构建方法中,筛选重要性高于0.01的RNA编辑位点时,为了尽可能降低标志的检测冗余性,在筛选出的特征中,如果同一个基因存在多个RNA编辑位点,仅保留重要性最高的位点。
[0024]作为本专利技术所述的基于RNA编辑水平的乳腺癌诊断模型的构建方法的优选实施方式,所述步骤(3)筛选出的候选RNA编辑位点包括以下RNA编辑位点:chr12:51324639:METTL7A、chr1:160966434:F11R、chr2:128951720:UGGT1、chr1:100489619:SLC35A3、chr12:69237519:MDM2、chr8:11700419:CTSB、chr4:177252238:SPCS3、chr1:179042905:FAM20B、chr1:168220280:TBX19和chr7:17384440:AHR。
[0025]本专利技术还提供一种由上述方法构建的基于RNA编辑水平的乳腺癌诊断模型。本专利技术所构建的乳腺癌诊断模型具有较高的诊断价值,鉴别乳腺癌的AUC值可达到0.9858。
[0026]本专利技术还提供述的诊断模型在制备预测乳腺癌的产品中的应用。
[0027]本专利技术的有益效果为:本专利技术提供了一种基于RNA编辑水平的乳腺癌分子标志物及诊本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于RNA编辑水平的乳腺癌分子标志物,其特征在于,以人类参考基因组hg19为基准,所述分子标志物包括以下RNA编辑位点:chr12:51324639:METTL7A、chr1:160966434:F11R、chr2:128951720:UGGT1、chr1:100489619:SLC35A3、chr12:69237519:MDM2、chr8:11700419:CTSB、chr4:177252238:SPCS3、chr1:179042905:FAM20B、chr1:168220280:TBX19和chr7:17384440:AHR。2.如权利要求1所述的分子标志物,其特征在于,所述分子标志物的RNA编辑位点的编辑水平在乳腺癌中异常增高。3.如权利要求1所述的分子标志物在制备检测乳腺癌的产品中的应用。4.如权利要求3所述的应用,其特征在于,所述产品采用多重PCR方法或高通量测序的方法检测样本的RNA编辑位点的编辑水平。5.一种基于RNA编辑水平的乳腺癌诊断模型的构建方法,其特征在于,包括以下步骤:(1)获取乳腺癌患者和正常组织样本的RNA编辑水平数据,得到每行为分析样本,每列为RNA编辑位点的编辑水平信息的二维矩阵;(2)剔除未检测到RNA编辑水平的位点;(3)根据特征重要性筛选候选RNA编辑位点;(4)将步骤(3)筛选出的RNA编辑位点作为特征,利用随机森林算法进行拟合,构建乳腺癌诊断模型。6.如权利要求5所述的基于RNA编辑水平的乳腺癌诊断模型的构建方法,其特征在于,所述步骤(2)的剔除的未检测到RNA编辑水平的位点为在20%及以上的样本中未检测到...

【专利技术属性】
技术研发人员:王金凯郭文冰
申请(专利权)人:中山大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1