基于CNN的先天性耳聋疾病预测方法、系统以及终端技术方案

技术编号:26344963 阅读:42 留言:0更新日期:2020-11-13 21:04
本发明专利技术提供一种基于CNN的先天性耳聋疾病预测方法、系统以及终端,解决了现有技术中利用人工诊断法进行耳聋基因检测耗时较长,以及利用软件分析法进行耳聋基因检测具有局限性,导致评价与鉴定各基因的综合致病结果工作目前仍然较为困难的问题。本发明专利技术针对所有耳聋常见基因位点进行分析,依托大数据平台设计自适应性机器学习算法模型,通过大量训练实现快速准确的耳聋基因数据分析与预测,对耳聋基因检测分析不仅速度快、预测准确率高以及成本低,本专利还具有模块化程度高,可移植性强,使用方便以及数据适应性较强的优点。

Prediction method, system and terminal of congenital deafness based on CNN

【技术实现步骤摘要】
基于CNN的先天性耳聋疾病预测方法、系统以及终端
本专利技术涉及医疗领域,特别是涉及一种基于CNN的先天性耳聋疾病预测方法、系统以及终端。
技术介绍
先天性耳聋是人类常见的出生缺陷之一,其中遗传因素是先天性耳聋最主要的致病原因。随着基因检测技术的发展和日臻成熟,基因诊断和遗传学分析在耳聋疾病的预防中发挥了重要作用。新生儿听力筛查与耳聋基因筛查与诊断的普及有助于明确先天性耳聋病因并实现早期干预。随着遗传咨询和产前诊断的开展,对耳聋基因检测数据解读与分析的要求也在逐步提高,至今发现的非综合征型聋的致病基因有约110个,评价与鉴定各基因的综合致病结果目前仍然较为困难。现行的耳聋基因分析方法主要包括人工诊断和软件分析两类,人工诊断法依据临床医生的经验与遗传学理论对基因数据展开解释,耗时较长但准确度高;软件分析则采用通用基因分析软件预测基因突变结果,此方法速度较快,但只适用于单个基因的突变分析。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种基于CNN的先天性耳聋疾病预测方法、系统以及终端,用于解决现有技术中利用人工诊断法进行耳聋基因检测耗时较长,以及利用软件分析法进行耳聋基因检测具有局限性,导致评价与鉴定各基因的综合致病结果工作目前仍然较为困难的问题。为实现上述目的及其他相关目的,本专利技术提供一种基于CNN的先天性耳聋疾病预测方法,所述方法包括:取包含多个带有标签值的原始样本的原始位点筛查数据,其中,所述标签值与记录在原始样本中的各个耳聋疾病基因中各位点数据相关;对原始位点筛查数据进行预处理,获得离散化的特征样本数据;将所述离散化的特征样本数据输入至CNN模型中进行训练,以构建耳聋疾病预测模型;当接收到经过预处理的待检测病历数据时,基于所述耳聋疾病预测模型,输出对应于所述待检测病历数据的预测结果。于本专利技术的一实施例中,对原始位点筛查数据进行预处理,获得离散化的特征样本数据的方式包括:将所述原始位点筛查数据拆分为所述各耳聋疾病基因片段上的各位点映射的特征样本数据;对各特征样本数据中测序失误的数据进行数据填充;对数据填充后的样本数据补充额外的离散化特征信息;对补充额外的离散化特征信息的数据中的连续化数据特征进行离散化,以获得离散化的特征样本数据。于本专利技术的一实施例中,待检测病历数据的预处理的方式包括:将待检测病历数据拆分为所述各耳聋疾病基因片段上的各位点映射的特征数据;对各特征数据中测序失误的数据进行数据填充;对数据填充后的数据补充额外的离散化特征信息;对补充额外的离散化特征信息的数据中的连续化数据特征进行离散化,以获得离散化的特征数据。于本专利技术的一实施例中,所述耳聋疾病基因包括:GJB2,MT以及SLC26A4基因中的一种或多种。于本专利技术的一实施例中,将所述离散化的特征样本数据输入至CNN模型中进行训练,以构建耳聋疾病预测模型的方式包括:对所述离散化的特征样本数据进行数据清洗和/或数据重采样;将经过数据清洗和/或数据重采样的所述离散化的特征样本数据输入至CNN模型中进行训练,以构建耳聋疾病预测模型。于本专利技术的一实施例中,所述数据清洗的方式包括:剔除各个耳聋疾病基因中各位点值为零的原始样本;和/或,将所述原始位点筛查数据中的冲突样本剔除,其中,所述冲突样本包括:各耳聋疾病基因中各位点值相同且标签值不同的多个样本。于本专利技术的一实施例中,所述数据重采样的方式包括:基于SMOTE合成算法,对所述离散化的特征样本数据中少数类进行插值以及过采样,获得合理的类别分布的重采样样本。于本专利技术的一实施例中,所所述CNN模型包括:依次连接的嵌入层、多维卷积层、池化层、输入层、全连接层以及输出层。为实现上述目的及其他相关目的,本专利技术提供一种基于CNN的先天性耳聋疾病预测系统,所述系统包括:获取模块,用于获取包含多个带有标签值的原始样本的原始位点筛查数据,其中,所述标签值与记录在原始样本中的各个耳聋疾病基因中各位点数据相关;预处理模块,连接所述获取模块,用于对原始位点筛查数据进行预处理,获得离散化的特征样本数据;模型构建模块,连接所述预处理模块,用于将所述离散化的特征样本数据输入至CNN模型中进行训练,以构建耳聋疾病预测模型;预测模块,连接所述模型构建模块,用于当接收到经过预处理的待检测病历数据时,基于所述耳聋疾病预测模型,输出对应于所述待检测病历数据的预测结果。为实现上述目的及其他相关目的,本专利技术提供一种基于CNN的先天性耳聋疾病预测终端,包括:存储器,用于存储计算机程序;处理器,运行所述计算机程序,以执行所述基于CNN的先天性耳聋疾病预测方法。如上所述,本专利技术的基于CNN的先天性耳聋疾病预测方法、系统以及终端,具有以下有益效果:本专利技术针对所有耳聋常见基因位点进行分析,依托大数据平台设计自适应性机器学习算法模型,通过大量训练实现快速准确的耳聋基因数据分析与预测,对耳聋基因检测分析不仅速度快、预测准确率高以及成本低,本专利还具有模块化程度高,可移植性强,使用方便以及数据适应性较强的优点。附图说明图1显示为本专利技术一实施例中基于CNN的先天性耳聋疾病预测方法的流程示意图。图2显示为本专利技术一实施例中预处理的流程示意图。图3显示为本专利技术一实施例中数据重采样的流程示意图。图4显示为本专利技术一实施例中CNN模型的训练过程的流程示意图。图5显示为本专利技术一实施例中基于CNN的先天性耳聋疾病预测系统的结构示意图。图6显示为本专利技术一实施例中基于CNN的先天性耳聋疾病预测终端的结构示意图。具体实施方式以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。需要说明的是,在下述描述中,参考附图,附图描述了本专利技术的若干实施例。应当理解,还可使用其他实施例,并且可以在不背离本专利技术的精神和范围的情况下进行机械组成、结构、电气以及操作上的改变。下面的详细描述不应该被认为是限制性的,并且本专利技术的实施例的范围仅由公布的专利的权利要求书所限定。这里使用的术语仅是为了描述特定实施例,而并非旨在限制本专利技术。空间相关的术语,例如“上”、“下”、“左”、“右”、“下面”、“下方”、““下部”、“上方”、“上部”等,可在文中使用以便于说明图中所示的一个元件或特征与另一元件或特征的关系。在通篇说明书中,当说某部分与另一部分“连接”时,这不仅包括“直接连接”的情形,也包括在其中间把其它元件置于其间而“间接连接”的情形。另外,当说某种部分“包括”某种构成要素时,只要没有特别相反的记载,则并非将其它构成要素,排除在外,而是意味着可以还包括其它构成要素。其中提到的第一、第二及第三等术语是为了说明多样的部分、成份、区域、层及/或段而使用的,但并非本文档来自技高网...

【技术保护点】
1.一种基于CNN的先天性耳聋疾病预测方法,其特征在于,所述方法包括:/n获取包含多个带有标签值的原始样本的原始位点筛查数据,其中,所述标签值与记录在原始样本中的各个耳聋疾病基因中各位点数据相关;/n对所述原始位点筛查数据进行预处理,获得离散化的特征样本数据;/n将所述离散化的特征样本数据输入至CNN模型中进行训练,以构建耳聋疾病预测模型;/n当接收到经过预处理的待检测病历数据时,基于所述耳聋疾病预测模型,输出对应于所述待检测病历数据的预测结果。/n

【技术特征摘要】
1.一种基于CNN的先天性耳聋疾病预测方法,其特征在于,所述方法包括:
获取包含多个带有标签值的原始样本的原始位点筛查数据,其中,所述标签值与记录在原始样本中的各个耳聋疾病基因中各位点数据相关;
对所述原始位点筛查数据进行预处理,获得离散化的特征样本数据;
将所述离散化的特征样本数据输入至CNN模型中进行训练,以构建耳聋疾病预测模型;
当接收到经过预处理的待检测病历数据时,基于所述耳聋疾病预测模型,输出对应于所述待检测病历数据的预测结果。


2.根据权利要求1所述的基于CNN的先天性耳聋疾病预测方法,其特征在于,对所述原始位点筛查数据进行预处理,获得离散化的特征样本数据的方式包括:
将所述原始位点筛查数据拆分为所述各耳聋疾病基因片段上的各位点映射的特征样本数据;
对各特征样本数据中测序失误的数据进行数据填充;
对数据填充后的样本数据补充额外的离散化特征信息;
对补充额外的离散化特征信息的数据中的连续化数据特征进行离散化,以获得离散化的特征样本数据。


3.根据权利要求1或2所述的基于CNN的先天性耳聋疾病预测方法,其特征在于,所述待检测病历数据的预处理的方式包括:
将待检测病历数据拆分为所述各耳聋疾病基因片段上的各位点映射的特征数据;
对各特征数据中测序失误的数据进行数据填充;
对数据填充后的数据补充额外的离散化特征信息;
对补充额外的离散化特征信息的数据中的连续化数据特征进行离散化,以获得离散化的特征数据。


4.根据权利要求1所述的基于CNN的先天性耳聋疾病预测方法,其特征在于,所述耳聋疾病基因包括:GJB2,MT以及SLC26A4基因中的一种或多种。


5.根据权利要求1所述的基于CNN的先天性耳聋疾病预测方法,其特征在于,将所述离散化的特征样本数据输入至CNN模型中进行训练,以构建耳聋疾病预测模型的方式包括:
对所述离散化的特征样本...

【专利技术属性】
技术研发人员:吴皓陈晓禾洪凯程杨涛郭宇李风美罗晓梅
申请(专利权)人:上海交通大学医学院附属第九人民医院中国科学院苏州生物医学工程技术研究所
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1