当前位置: 首页 > 专利查询>王海燕专利>正文

基于血清质谱自适应稀疏特征选择的卵巢癌微创快检技术制造技术

技术编号:20076072 阅读:90 留言:0更新日期:2019-01-15 00:55
基于血清质谱自适应稀疏特征选择的卵巢癌微创快检技术。本发明专利技术将血清软电离飞行时间质谱技术与带稀疏惩罚性的特征选择算法相结合,形成了一种卵巢癌的微创快检技术体系。本发明专利技术针对血清样本的飞行时间质谱数据特点,设计了带稀疏惩罚性的自适应特征选择算法。该特征选择方法能够从原始的一万多维质谱数据中选择得到20个关键特征,进一步对这20个特征做流形学习,将特征降到2维,可得线性可分的可视化结果,在常规的线性SVM等分类器上即可得到非常好的分类效果。在公共数据集上开展的实验证明了本方法在卵巢癌的判别上的有效性。

Minimally invasive rapid detection of ovarian cancer based on self-adaptive sparse feature selection of serum mass spectrometry

Minimally invasive rapid detection of ovarian cancer based on self-adaptive sparse feature selection of serum mass spectrometry. The invention combines serum soft ionization time-of-flight mass spectrometry technology with sparse punitive feature selection algorithm to form a minimally invasive rapid detection technology system for ovarian cancer. According to the characteristics of time-of-flight mass spectrometry data of serum samples, an adaptive feature selection algorithm with sparse punitive property is designed. This feature selection method can select 20 key features from the original 10,000-dimensional mass spectrometry data. Further manifold learning of these 20 features can reduce the feature to 2-dimensional, and the visualization results can be linearly separable. Good classification results can be obtained on conventional linear SVM classifiers and other classifiers. Experiments on public datasets demonstrate the effectiveness of this method in identifying ovarian cancer.

【技术实现步骤摘要】
基于血清质谱自适应稀疏特征选择的卵巢癌微创快检技术
本专利技术属于基于质谱数据的疾病筛查领域,特别涉及了基于血清样本飞行时间质谱的卵巢癌快速判别技术。
技术介绍
据调查,中国每年新发卵巢癌患者约52,100例,死亡22,500例。在妇科恶性肿瘤排名中,卵巢癌的发病率高居第三位,最低生存率仅为39%,5年复发率最高,达到70%。对卵巢癌的诊断和预防具有重大的社会意义。相对于穿刺细胞活检、腹腔镜等传统检测手段,基于血清样本的质谱检测技术是一种微创、简便、快速的检测手段。基于质谱的快检技术进入实用阶段的关键是高灵敏度、高准确率的数据判别方法,因此很有必要针对卵巢癌血清质谱这种高维稀疏数据的判别方法开展研究。
技术实现思路
专利技术目的:本专利技术的目的是为现有的卵巢癌检测手段,提高一种微创、高效的检测方面。本专利技术以软电离飞行时间质谱仪为数据源,针对采集到的数据的高维稀疏特点,设计相应的特征降维处理流程,以实现高效的卵巢癌诊断判别。技术方案为达到以上目的,本专利技术采用的技术方案为:基于血清质谱自适应稀疏特征选择的卵巢癌微创快检技术,具体步骤为:(1)数据获取将分离后的血清样本应用到疏水性C本文档来自技高网...

【技术保护点】
1.基于血清质谱自适应稀疏特征选择的卵巢癌微创快检技术,其特征在于包括以下步骤:(1)数据获取样品准备:将分离后的血清样本应用到疏水性C16蛋白质芯片,使用α‑氰基‑4‑羟基肉桂酸作为基质,该基质能够有效电离低于20000质荷比的多肽和蛋白质。仪器设定:软电离飞行时间质谱仪,设置激光强度240,探测器灵敏度10,质量聚焦6000,位置50,检测范围0‑20000Da,每个样本电离40~80次。(2)数据分析数据预处理:飞行时间质谱记录的各质荷比离子的数量量级差别较大,采用以下特征归一化方法:

【技术特征摘要】
1.基于血清质谱自适应稀疏特征选择的卵巢癌微创快检技术,其特征在于包括以下步骤:(1)数据获取样品准备:将分离后的血清样本应用到疏水性C16蛋白质芯片,使用α-氰基-4-羟基肉桂酸作为基质,该基质能够有效电离低于20000质荷比的多肽和蛋白质。仪器设定:软电离飞行时间质谱仪,设置激光强度240,探测器灵敏度10,质量聚焦6000,位置50,检测范围0-20000Da,每个样本电离40~80次。(2)数据分析数据预处理:飞行时间质谱记录的各质荷比离子的数量量级差别较大,采用以下特征归一化方法:特征选择:飞行时间质谱数据往往有几万甚至几十万的维数特征量,直接用于分类训练计算量过大,而且其中的很多相关性不高或者不相关的特征量对于判别分类有较大干扰。首先定义待优化的代价函数:该代价函数同时包含了L1和L2范数,L2范数对应岭回归正则化,L1范数对应LASSO正则化,是稀疏惩罚项。为确定最优的λ1和λ2,采用网格搜索和交叉验证的方法,自适应选择最优超参数,即求解:为特定超参数取值下优化误差代价函数求得的回归模型。根据最终选定的回归模型,按照系数θ绝对值的大小逆序选出20个特征。理论上,经过稀疏惩罚项的系数抑制作用,应观察到后面的大多数特征系数取值为0。流形学习特征降...

【专利技术属性】
技术研发人员:王海燕张寅升程永波夏波涌王祥胜左超李靓
申请(专利权)人:王海燕江苏易谱恒科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1