利用脂质生物标志物预测乳腺癌的方法技术

技术编号:16080299 阅读:62 留言:0更新日期:2017-08-25 15:39
本发明专利技术公开了一种利用脂质生物标志物预测乳腺癌的方法,通过OPLS‑DA模型,筛选出正常人组群和乳腺癌组群之间的10个差异性化合物,即与乳腺癌相关的脂质生物标志物,并通过构建逻辑回归模型,得到根据这些脂质标志物预测乳腺癌的方法,快捷方便,准确度达到93.9%。

【技术实现步骤摘要】
利用脂质生物标志物预测乳腺癌的方法
本专利技术涉及生物
,尤其涉及一种利用脂质生物标志物预测乳腺癌的方法,能够准确预测乳腺癌。
技术介绍
与其他大多数国家一样,乳腺癌也成为了中国女性最常见的癌症;每年中国乳腺癌新发数量和死亡数量分别占全世界的12.2%和9.6%。中国对全球的“贡献率”逐步增加,主要归因于中国社会经济地位的提高和特殊的生育模式。90年代以来,中国的乳腺癌发病率增长速度是全球的两倍多,城市地区尤为显著。目前,乳腺癌是中国女性发病率最高的癌症,癌症死亡原因位居第六。截至2008年,中国总计169452例新发乳腺癌,44908例死于乳腺癌,分别占到全世界的12.2%和9.6%。如果这一趋势保持不变,到2021年,中国乳腺癌患者将高达250万,发病率将从不到60例/10万女性(年龄在55岁到69岁之间)增加到超过100例/10万女性。目前对乳腺癌的筛查,主要通过X线检查。然而,中国57%的患者都在一个年龄段发作。这一结果也暗示乳腺X线检查,不是非常有效的筛查手段,并且具有无法实施的障碍,包括:缺乏令人信服的成本效果分析数据;人群分布广泛;器材设备缺乏;医疗保险未覆盖此项目。同时,中国还没有全国范围内的筛查项目;所以,开发快速而且高效的乳腺癌生物标志物,具有重要的意义和市场前景。研究表明,脂质代谢与组织病变有非常直接的联系,也包括乳腺癌。迄今为止,利用脂质和代谢组的分析手段,发现了39个代谢物与乳腺癌发生有关,包括:黄嘌呤(xanthine),葡萄糖6-磷酸(glucose-6-phosphate),甘露糖-6-磷酸(mannose-6-phosphate),鸟嘌呤(guanine),腺嘌呤(adenine)等等。另外,研究也发现,大部分的磷脂含量在乳腺癌细胞中都显著升高。特别地,磷脂酰丝氨酸phosphatidylserine(PS)18:0/20:4,磷脂酰肌醇phosphatidylinositol(PI)18:0/20:4,磷脂酰胆碱phosphatidylcholine(PC)18:0/20:4,在乳腺癌细胞中显著增加;而磷脂酰乙醇胺phosphatidylethanolamine(PE)18:1/18:1和磷脂酰肌醇PI18:0/18:1显著降低.但是,目前为止,还没有出现能够利用这些标志物准确预测乳腺癌的预测模型,尤其是针对中国人群的乳腺癌预测模型。
技术实现思路
本专利技术的一个目的是解决至少上述问题,并提供至少后面将说明的优点。本专利技术还有一个目的是提供一种利用脂质生物标志物预测乳腺癌的方法,能够快捷、准确、高效地预测乳腺癌。本专利技术还有一个目的是提供一种针对中国人群的利用脂质生物标志物预测乳腺癌的方法。本专利技术还有一个目的是提供一组针对中国人群的与乳腺癌密切相关的化合物。为了实现根据本专利技术的这些目的和其它优点,提供了以下技术方案:一种利用脂质生物标志物预测乳腺癌的方法,其中,主要包括以下步骤:步骤1、筛选出正常人组群和乳腺癌组群之间VIP值大于5的排名前9位的差异性化合物R1-R9,分别为表1所示:表1步骤2、利用逻辑回归模型2进行计算,得到TC值,所述逻辑回归模型2的计算公式为:TC=3.564+6.135*R6+5.375*R7-1.814*R8-2.943*R9+1.151*R10;步骤3、根据所得TC值进行判断,TC=0为否;TC=1为是。优选的是,步骤1中利用OPLS-DA模型对差异性化合物进行筛选,筛选条件VIP>1。优选的是,步骤1中筛选的具体方法为:步骤1.1将样品进行超高效液相色谱和质谱分析,得到脂质组学数据,将正常人组群和乳腺癌组群分别计为CK及RC;步骤1.2对脂质组学数据进行标准化操作,利用OPLS-DA模型对CK及RC进行S-plot分布得到S形曲线,并进行强制分组,计算影响CK及RC分组的变量重要性,即得VIP值;步骤1.3按照VIP值大于1的标准得到10个化合物,并将该10个化合物作为与乳腺癌相关度最高的差异性化合物;步骤1.4将所得10个化合物按照VIP值大小从高到低排列,取前9位,即得步骤1中所述差异性化合物R1-R9。优选的是,步骤2中TC值或者用逻辑回归模型1进行计算,所述逻辑回归模型1的计算公式为:TC=-8.673-32.803*R1+19.399*R2+8.738*R3-20.88*R8+2.217*R9+1.607*R10。优选的是,步骤2中TC值或者用逻辑回归模型3进行计算,所述逻辑回归模型3的计算公式为:TC=0.7564-2.6459*R8+2.524*R9+1.5554*R10。本专利技术至少包括以下有益效果:本专利技术通过筛选,首次发现与乳腺癌相关的一组化合物,即与乳腺癌相关的脂质生物标志物,并通过构建逻辑回归模型,得到根据这些脂质标志物预测乳腺癌的方法,快捷方便,准确度高。通过AIC值初步判断,并进行ROC曲线绘制,AUC值达到0.939。本专利技术的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本专利技术的研究和实践而为本领域的技术人员所理解。附图说明图1为本专利技术中所述的OPLS-DA模型的S-plot分布图;图2为本专利技术中利用OPLS-DA模型对CK和RC进行强制分组的结果;图3为本专利技术中用来考察筛选出的化合物的火山图;图4为本专利技术中ROC曲线图。具体实施方式下面结合附图对本专利技术做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。应当理解,本文所使用的诸如“具有”、“包含”以及“包括”术语并不配出一个或多个其它元件或其组合的存在或添加。一种利用脂质生物标志物预测乳腺癌的方法,其中,主要包括以下步骤:步骤1、筛选出正常人组群和乳腺癌组群之间VIP值大于5的排名前9位的差异性化合物R1-R9,分别为表1所示。其中,所述VIP值表示差异性的大小,所述R1-R9按照VIP值从高到低顺次排列。表1步骤2、利用逻辑回归模型2进行计算,得到TC值,所述逻辑回归模型2的计算公式为:TC=3.564+6.135*R6+5.375*R7-1.814*R8-2.943*R9+1.151*R10;经过ROC曲线绘制,模型2的AUC值为0.939,准确度高达93.9%。步骤3、根据所得TC值进行判断,TC=0为否;TC=1为是。绘制ROC曲线,模型1所得AUC值为0.939,即准确度为93.9%,准确度高。其中,公式中R1-R10均为测量样品中各种脂质的含量。一个优选方案中,步骤1中利用OPLS-DA模型对差异性化合物进行筛选,筛选条件VIP>1。一个优选方案中,步骤1中筛选的具体方法为:步骤1.1将样品进行超高效液相色谱和质谱分析,得到脂质组学数据,将正常人组群和乳腺癌组群分别计为CK及RC;步骤1.2对脂质组学数据进行标准化操作,利用OPLS-DA模型对CK及RC进行S-plot分布得到S形曲线,并进行强制分组,计算影响CK及RC分组的变量重要性,即得VIP值;步骤1.3按照VIP值大于1的标准得到10个化合物,并将该10个化合物作为与乳腺癌相关度最高的差异性化合物;步骤1.4将所得10个化合物按照VIP值大小从高到低排列,取前9位,即得步骤1中所述差异性化合物R1-R9。一个优选方案中,步骤2中TC值或者用逻本文档来自技高网
...
利用脂质生物标志物预测乳腺癌的方法

【技术保护点】
一种利用脂质生物标志物预测乳腺癌的方法,其特征在于,主要包括以下步骤:步骤1、筛选出正常人组群和乳腺癌组群之间VIP值大于5的排名前9位的差异性化合物R1‑R9,分别为表1所示:表1

【技术特征摘要】
1.一种利用脂质生物标志物预测乳腺癌的方法,其特征在于,主要包括以下步骤:步骤1、筛选出正常人组群和乳腺癌组群之间VIP值大于5的排名前9位的差异性化合物R1-R9,分别为表1所示:表1步骤2、利用逻辑回归模型2进行计算,得到TC值,所述逻辑回归模型2的计算公式为:TC=3.564+6.135*R6+5.375*R7-1.814*R8-2.943*R9+1.151*R10;步骤3、根据所得TC值进行判断,TC=0为否;TC=1为是。2.如权利要求1所述的利用脂质生物标志物预测乳腺癌的方法,其特征在于,步骤1中利用OPLS-DA模型对差异性化合物进行筛选,筛选条件VIP>1。3.如权利要求2所述的利用脂质生物标志物预测乳腺癌的方法,其特征在于,步骤1中筛选的具体方法为:步骤1.1将样品进行超高效液相色谱和质谱分析,得到脂质组学数据,将正常人组群和乳腺癌组群分别计为CK及RC;步骤1.2对脂质组学数据进行标准化操作,利用OPLS...

【专利技术属性】
技术研发人员:王文军陈显扬萨日娜马占青任素玲段晓波
申请(专利权)人:北京骐骥生物技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1