当前位置: 首页 > 专利查询>西北大学专利>正文

基于唾液凝集素芯片数据的肺病识别工具及系统技术方案

技术编号:34169822 阅读:40 留言:0更新日期:2022-07-17 10:29
本发明专利技术提供了基于唾液凝集素芯片数据的肺病识别工具及系统,包括:处理器和存储介质;存储介质用于在存储的程序被所述处理器加载时执行以下步骤:利用肺部病变鉴别模型对待诊断患者的唾液的凝集素芯片数据进行鉴别,确定所述待诊断患者为:健康志愿者、肺部良性病变患者或肺癌患者。本发明专利技术所述的肺病识别工具,通过肺癌诊断模块对待诊断患者的唾液进行鉴别,确定所述待诊断样本是否为肺病样本及确认肺癌类型。本发明专利技术所述的肺病识别工具具有采样方便、灵敏度高的特点,适合对病人进行早、中期筛查,能够快速鉴别受试者的肺部病变情况。能够快速鉴别受试者的肺部病变情况。能够快速鉴别受试者的肺部病变情况。

Lung disease recognition tool and system based on salivary lectin chip data

【技术实现步骤摘要】
基于唾液凝集素芯片数据的肺病识别工具及系统


[0001]本专利技术涉及生物计算机领域,尤其涉及一种基于唾液凝集素芯片数据的肺病识别工具及系统。

技术介绍

[0002]肺部恶性肿瘤是造成癌症患者死亡的重要因素之一,几乎五分之一的癌症患者死于肺癌。已有的唾液癌症筛查主要通过凝集素芯片进行,凝集素(Lectin)是非免疫来源的、不具有酶活性的一类糖结合蛋白,能专一地识别某一特殊结构的单糖或聚糖中特定的糖链序列并与之结合,而凝集素芯片是一种将各种不同来源的凝集素固定于环氧化修饰的芯片片基上制成的生物芯片。
[0003]现有的凝集素芯片鉴别癌症的方法主要是:选定对照组,将待检测临床样本的凝集素芯片结果同健康对照组的凝集素芯片结果进行对比,得到每种凝集素的Fold

change值,以Fold

change>1.5和Fold

change<0.67作为选择标准,Fold

change>1.5为上调糖链,Fold

change<0.67为下调糖链,筛选出表达上调和下调的糖链组合,利用这些糖链的组合来判断某种癌症。这种方法应用的凝集素数据不全面,仅应用了显示糖链结构上调或下调的凝集素数据,复杂情景下缺乏实际应用价值。因此,一种准确性高的肺病识别系统亟待研发。

技术实现思路

[0004]为了克服现有技术的不足,本专利技术提供了基于唾液凝集素芯片数据的肺癌识别工具及系统,用于解决前述技术问题中的至少一个。
[0005]具体地,其技术方案如下:
[0006]一种基于唾液凝集素芯片数据的肺病识别工具,包括:
[0007]存储介质,用于在存储的程序被所述处理器加载时执行以下步骤:
[0008]利用肺部病变鉴别模型对待诊断患者的唾液的凝集素芯片数据进行鉴别,确定所述待诊断患者为:健康志愿者、肺部良性病变患者或肺癌患者。
[0009]所述肺癌患者,包括:小细胞肺癌患者、肺腺癌患者或肺鳞癌患者。
[0010]上述的一种基于唾液凝集素芯片数据的肺病识别工具,还包括:采集模块;
[0011]所述采集模块采集外界样本,用于执行以下步骤后,将所述外界样本发送至所述存储介质:
[0012]将收集到的全唾液经离心后,吸取上清弃去沉淀;
[0013]将所述上清再经过滤后,经荧光染料标记后,去掉游离荧光,得到荧光标记的预处理后的唾液样本。
[0014]上述的一种基于唾液凝集素芯片数据的肺病识别工具,还包括,预处理模块:
[0015]所述预处理模块,与所述采集单元和所述存储介质进行数据交互,用于执行以下步骤后,将凝集素芯片数据发送至所述存储介质内:
[0016]将点制好的凝集素芯片进行清洗,得到清洁后的凝集素芯片;
[0017]将清洁后的凝集素芯片与封闭缓冲液在芯片杂交盒中孵育,进行旋转反应,得到封闭后的凝集素芯片;
[0018]将所述荧光标记的预处理后的唾液样本与孵育缓冲液混匀,配置成上样体系,并均匀加载在盖玻片上;
[0019]将封闭后的凝集素芯片置于所述盖玻片上,进行避光旋转孵育,孵育结束后清洗玻片,离心甩干,得到待扫描芯片;
[0020]扫描所述待扫描芯片,将芯片扫描结果经过图像分析后,进行数据的归一化处理,获得所述凝集素芯片数据。
[0021]一种基于唾液凝集素芯片数据的肺病识别系统,包括:
[0022]数据采集模块,用于根据唾液样本获取凝集素芯片数据;
[0023]模型构建模块,与所述数据采集模块进行数据交互,用于利用所述凝集素芯片数据形成分类标签和特征,从而构建和训练肺部病变鉴别模型;
[0024]如上所述的肺病识别工具,与所述数据采集模块进行数据交互,用于利用已训练的肺部病变鉴别模型对待诊断患者的唾液进行鉴别,确定所述待诊断患者为:健康志愿者、肺部良性病变患者或肺癌患者。
[0025]所述模型构建模块,包括:
[0026]数据预处理单元,与所述数据采集模块进行数据交互,用于将所述凝集素芯片数据进行归一化处理,得到归一化后的凝集素芯片数据;
[0027]数据分类单元,与所述数据预处理单元进行数据交互,用于将所述归一化后的凝集素芯片数据随机排序,获取所述归一化后的凝集素芯片数据的特征和标签,并按照所述标签随机选取一部分所述归一化后的凝集素芯片数据作为所述肺部病变鉴别模型的训练集,另一部分所述归一化后的凝集素芯片数据作为所述肺部病变鉴别模型的测试集;
[0028]构建单元,与所述肺病识别工具连接,用于得到所述训练后的肺部病变鉴别模型并存储在所述肺病识别工具内。
[0029]所述构建单元与所述数据分类单元连接,用于利用所述特征和标签通过K最近邻算法、支撑向量机、多层感知器、逻辑回归以及随机森林中的任一种算法依据所述凝集素芯片数据构建所述肺部病变鉴别模型。
[0030]所述构建单元接收所述标签和特征,用于通过以下步骤依据所述凝集素芯片数据构建所述肺部病变鉴别模型:
[0031]利用Bootstraping方法随机取出m个样本,共进行n_tree次采样,生成n_tree个训练集;
[0032]对所述n_tree个训练集,分别训练n_tree个决策树模型;
[0033]对于单个所述决策树模型,设定训练样本特征的个数为n,在每个节点分裂时,根据信息增益或信息增益比或基尼指数选择特征进行分裂,直到该节点的所有训练样例都属于同一类;
[0034]将生成的多颗决策树组成随机森林,按照多棵树分类器投票决定最终分类结果,得到所述肺部病变鉴别模型。
[0035]所述模型构建模块,还包括:参数选择与优化单元;
[0036]所述参数选择与优化单元与所述构建单元进行数据交互,用于通过以下步骤对所述肺部病变鉴别模型进行调整:
[0037]调整所述肺部病变鉴别模型影响最大的参数n_estimators,用Gridsearch探索n_estimators得出最佳值;
[0038]对所述决策树的最大深度进行调节,在不改变所述肺部病变鉴别模型效果的前提下,搜索更小的max_depth,进行网格搜索,得出max_depth最优参数;
[0039]对所述决策树的内部节点再划分所需的最小样本数min_samples_split和叶子节点最少样本数min_samples_leaf同时调参,得出的最佳参数min_samples_split和min_samples_leaf的值;
[0040]对最大特征数max_features做调参,得出最佳参数max_features的值。
[0041]所述数据采集模块,包括:
[0042]采集单元,用于收集唾液样本;
[0043]标记单元,与所述采集单元连接,用于对所述唾液样本进行荧光标记;
[0044]凝集素芯片单本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于唾液凝集素芯片数据的肺病识别工具,其特征在于,包括:处理器;存储介质,用于在存储的程序被所述处理器加载时执行以下步骤:利用肺部病变鉴别模型对待诊断患者的唾液的凝集素芯片数据进行鉴别,确定所述待诊断患者为:健康志愿者、肺部良性病变患者或肺癌患者。2.根据权利要求1所述的基于唾液凝集素芯片数据的肺病识别工具,其特征在于,所述肺癌患者,包括:小细胞肺癌患者、肺腺癌患者或肺鳞癌患者。3.根据权利要求1所述的基于唾液凝集素芯片数据的肺病识别工具,其特征在于,还包括:采集模块;所述采集模块采集外界样本,用于执行以下步骤后,将所述外界样本发送至所述存储介质:将收集到的全唾液经离心后,吸取上清弃去沉淀;将所述上清再经过滤后,经荧光染料标记后,去掉游离荧光,得到荧光标记的预处理后的唾液样本。4.根据权利要求3所述的基于唾液凝集素芯片数据的肺病识别工具,其特征在于,还包括,预处理模块:所述预处理模块,与所述采集单元和所述存储介质进行数据交互,用于执行以下步骤后,将凝集素芯片数据发送至所述存储介质内:将点制好的凝集素芯片的玻片进行清洗,得到清洁后的凝集素芯片;将清洁后的凝集素芯片与封闭缓冲液在芯片杂交盒中孵育,进行旋转反应,得到封闭后的凝集素芯片;将所述荧光标记的预处理后的唾液样本与孵育缓冲液混匀,配置成上样体系,并均匀加载在盖玻片上;将封闭后的凝集素芯片置于所述盖玻片上,进行避光旋转孵育,孵育结束后清洗玻片,离心甩干,得到待扫描芯片;扫描所述待扫描芯片,将芯片扫描结果经过图像分析后,进行数据的归一化处理,获得所述凝集素芯片数据。5.一种基于唾液凝集素芯片数据的肺病识别系统,其特征在于,包括:数据采集模块,用于根据唾液样本获取凝集素芯片数据;模型构建模块,与所述数据采集模块进行数据交互,用于利用所述凝集素芯片数据形成分类标签和特征,从而构建和训练肺部病变鉴别模型;如权利要求1所述的肺病识别工具,与所述数据采集模块进行数据交互,用于利用已训练的肺部病变鉴别模型对待诊断患者的唾液进行鉴别,确定所述待诊断患者为:健康志愿者、肺部良性病变患者或肺癌患者。6.根据权利要求5所述的基于唾液凝集素芯片数据的肺病识别系统,其特征在于,所述模型构建模块,包括:数据预处理单元,与所述数据采集模块进行数据交互,用于将所述凝集素芯片数据进行归一化处理,得到归一化后的凝集素芯片数据;数据分类单元,与所述数据预处理单元进行数据交互,用于将所述归一化后的凝集素
芯片数据随机排序,获取所述归一化后的凝集素芯片数据的特征和标签,并按照所述标签随机选取一部分所述归一化后的凝集素芯片数据作为所述肺部病变鉴别模型的训练集,另一部分所述归一化后的凝集素芯片数据作为所述肺部病变鉴别模型的测试集;构建...

【专利技术属性】
技术研发人员:李铮舒健张帆唐振于汉杰张宸
申请(专利权)人:西北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1