单基因病名称的推荐方法和系统技术方案

技术编号:30284270 阅读:25 留言:0更新日期:2021-10-09 21:54
本发明专利技术公开一种单基因病名称的推荐方法和系统,能够精准、高效、全面的推荐出用户所患的单基因病名称。该方法包括:将用户输入的特征集合I中的临床特征在标准化临床特征表型树上的节点标记;遍历特征关系数据库中的第n个单基因病名称,将其对应特征集合A中的标准临床特征在标准化临床特征表型树上的节点标记;基于标准化临床特征表型树上的节点标记,从特征集合A中匹配出与特征集合I每个临床特征一一对应的最佳标准临床特征;分别计算每个临床特征与对应最佳标准临床特征链路的离散增量,并累加得到总离散增量;令n=n+1重新遍历特征关系数据库中的第n个单基因病名称,直至特征关系数据库中的单基因病名称遍历完毕,将特征集合I与每个特征集合A对应的总离散增量汇总排序,输出最小总离散增量对应的单基因病名称。称。称。

【技术实现步骤摘要】
单基因病名称的推荐方法和系统


[0001]本专利技术涉数字医疗
,尤其涉及一种单基因病名称的推荐方法和系统。

技术介绍

[0002]出生缺陷又称先天缺陷,是指由于先天性、遗传性和不良环境等原因引起的出生时的各种结构性畸形和功能性异常的总称。全国出生缺陷率高达5.6%,我国年出生人口1600

2000万,每年新增出生缺陷数约为90万例,其中出生时临床明显可见的出生缺陷约有25万例,部分出生缺陷发生率呈上升态势。出生缺陷按照病因学分类可以分为三类:一是遗传因素引起的,包括染色体异常和单基因病突变;二是环境因素引起的,包括理化生物和生活方式等方面;三是遗传和环境因素共同作用导致。
[0003]除了染色体疾病,单基因病是引起出生缺陷最主要的遗传学病因。单基因遗传病是指疾病的发生主要受一个基因座上的基因控制,由于单个基因的突变而引起的遗传病,又称孟德尔遗传病。它的遗传方式遵循孟德尔定律,突变既可来自父母,也可源于自身,都有遗传给下一代的可能。它是由一对等位基因突变导致的疾病,又称孟德尔式遗传病,由于我国人口基数大,总数已近千万,已经对人口健康构成了较大的威胁。根据世界卫生组织WHO统计,在全球出生人口中所有单基因遗传病的累计发病率高达10%。单基因遗传病危害严重,大多数会致畸,致残甚至致死,缺乏有效治疗手段。
[0004]单基因病存在如下复杂的特点:1、单基因病种类繁多,目前OMIM数据库中记录的已经超过8000种,总发病率也高达1%以上;2、单基因病表型复杂,同一种单基因病表型异质性强,存在不同单基因病之间临床特征相互重叠的现象;3、单基因病遗传模式多样化,即使同一种单基因病,也可能表现为不同的遗传模式,不同的单基因病也可表现为相同的遗传模式。这些复杂因素将使得临床医生很难对所有的单基因病表型都非常了解,给单基因病临床诊疗带来了极大的困难,极易造成误诊和漏诊,也使得单基因病患者不得不反复到不同医院就诊,增大了单基因病患者家庭的经济负担和压力。
[0005]三级预防策略对单基因病的预防和控制发挥了较大的作用,一级预防指防止出生缺陷儿的发生,目前的措施有婚前检查、遗传咨询、孕前保健等,但其特异性不足,不能有效预防遗传性出生缺陷;二级预防指在孕期通过早发现、早诊断和早干预,减少缺陷儿的出生,孕产期保健服务、产前筛查和产前诊断是目前二级预防的主要措施;三级预防是指在出生缺陷儿的出生后采取及时、有效的诊断和治疗康复,以提高患儿的生活质量,防止或降低因病致残,促进健康,目前的主要措施有先天性甲低、PKU等遗传代谢病和听力障碍筛查工作。
[0006]随着精准医学时代到来,单基因病出生缺陷需要更加精准的三级预防。单基因病出生缺陷的精准预防必须对单基因病进行准确诊断,而准确的诊断不能仅仅依靠临床特征等表型信息,更需要通过遗传检测技术查明影响单基因病家庭或患儿的致病基因和突变。一旦查明单基因病家庭或患儿的致病基因和突变,则可以在三级预防的不同阶段进行更精准更有效的干预。通过单基因病家庭的致病突变确认,可进行遗传咨询和生育指导,譬如通
过植入前诊断或孕早期的产前诊断避免患儿的出生,实现更精准的一级和二级预防。精准医学时代下,单基因病的确诊最终需要通过遗传检测技术来帮助鉴定受累家庭或个体携带的致病变异,从而对单基因病患者和家庭进行遗传咨询和出生缺陷干预指导。通过对单基因病致病突变的遗传检测筛查,可早期发现早期确诊患儿,便可以早期进行治疗和康复,实现更精准的三级预防。
[0007]高通量基因组技术带来了基因组学大数据。计算机信息技术和数据库技术的不断成熟使得基因组学大数据能够方便的以各种形式进行高效率存储,为基因组学大数据的分析挖掘和共享提供了可能。在精准医学产生和发展的过程中,由于高通量而且成本急剧降低的测序技术在单基因病、肿瘤等复杂疾病中的大量应用,使得每天的数据量呈指数级增长,这些数据和其他组学数据和表型信息一起,组成了海量的生物医学数据。
[0008]虽然遗传基因测序技术作为临床单病例的单基因疾病分子诊断已经被证明了其可行性,也比传统检测方法可以节省时间。但是,目前市场上出现的单基因疾病高通量检测一般是单项或者常见几百种单基因病,检测成本从单项检测500到高覆盖率的为60000元不等,检测周期是:一般实验结果2

3周,纸质报告20工作日,成本昂贵且周期长。例如,华大基因、博奥检验、金维智、百迈客、安诺优达、万康源基因等推出的遗传基因检测相关的服务重在测序,是最基本的基础数据分析,挖掘相对粗略,同时对单基因病覆盖度也有限制,没有深入结合临床疾病表型和功能变异注释相关信息,确认单基因病及相关变异,没有精准和个性化的遗传解读分析。

技术实现思路

[0009]本专利技术的目的在于提供一种单基因病名称的推荐方法和系统,能够基于用户的临床特征,精准、高效、全面的推荐出用户所患的单基因病名称,有助于为临床医生对单基因病的辅助诊断和鉴别诊断提供线索。
[0010]为了实现上述目的,本专利技术的第一方面提供一种单基因病名称的推荐方法,包括:
[0011]根据单基因病名称的特征关系数据库,构建单基因病的标准化临床特征表型树;
[0012]将用户输入的特征集合I中的临床特征在标准化临床特征表型树上的节点标记;
[0013]遍历特征关系数据库中的第n个单基因病名称,将其对应特征集合A中的标准临床特征在标准化临床特征表型树上的节点标记,所述n的初始值为1;
[0014]基于标准化临床特征表型树上的节点标记,从特征集合A中匹配出与特征集合I每个临床特征一一对应的最佳标准临床特征;
[0015]根据共处根节点的临床特征与最佳标准临床特征的链路分布,分别计算每个临床特征与对应最佳标准临床特征链路的离散增量,并累加得到特征集合I与第n个单基因病名称中对应最佳标准临床特征的总离散增量;
[0016]令n=n+1重新遍历特征关系数据库中的第n个单基因病名称,直至特征关系数据库中的单基因病名称遍历完毕,将特征集合I与每个特征集合A对应的总离散增量汇总排序,输出最小总离散增量对应的单基因病名称。
[0017]优选地,链路分布的获取方法包括:
[0018]所述特征集合I包括多个临床特征,所述特征集合A包括多个标准临床特征;
[0019]遍历所述特征集合I中的第i个临床特征,从所述特征集合A中匹配出与所述第i个
临床特征对应的标准临床特征,作为与所述第i个临床特征对应的最佳标准临床特征,所述i的初始值为1;
[0020]令i=i+1后重新遍历所述特征集合I中的第i个临床特征,直至特征集合I中的临床特征遍历完毕,从第n个单基因病名称对应的特征集合A中筛选出与特征集合I中临床特征一一对应的多个最佳标准临床特征;
[0021]将所述特征集合I中的全部临床特征,以及特征集合A中一一对应的最佳标准临床特征在标准化临床特征表型树上做节点标记,统计出每个临床特征所对应的第一链路,以及每个最佳标准临床特征所对应的第二链路。...

【技术保护点】

【技术特征摘要】
1.一种单基因病名称的推荐方法,其特征在于,包括:根据单基因病名称的特征关系数据库,构建单基因病的标准化临床特征表型树;将用户输入的特征集合I中的临床特征在标准化临床特征表型树上的节点标记;遍历特征关系数据库中的第n个单基因病名称,将其对应特征集合A中的标准临床特征在标准化临床特征表型树上的节点标记,所述n的初始值为1;基于标准化临床特征表型树上的节点标记,从特征集合A中匹配出与特征集合I每个临床特征一一对应的最佳标准临床特征;根据共处根节点的临床特征与最佳标准临床特征的链路分布,分别计算每个临床特征与对应最佳标准临床特征链路的离散增量,并累加得到特征集合I与第n个单基因病名称中对应最佳标准临床特征的总离散增量;令n=n+1重新遍历特征关系数据库中的第n个单基因病名称,直至特征关系数据库中的单基因病名称遍历完毕,将特征集合I与每个特征集合A对应的总离散增量汇总排序,输出最小总离散增量对应的单基因病名称。2.根据权利要求1所述的方法,其特征在于,链路分布的获取方法包括:所述特征集合I包括多个临床特征,所述特征集合A包括多个标准临床特征;遍历所述特征集合I中的第i个临床特征,从所述特征集合A中匹配出与所述第i个临床特征对应的标准临床特征,作为与所述第i个临床特征对应的最佳标准临床特征,所述i的初始值为1;令i=i+1后重新遍历所述特征集合I中的第i个临床特征,直至特征集合I中的临床特征遍历完毕,从第n个单基因病名称对应的特征集合A中筛选出与特征集合I中临床特征一一对应的多个最佳标准临床特征;将所述特征集合I中的全部临床特征,以及特征集合A中一一对应的最佳标准临床特征在标准化临床特征表型树上做节点标记,统计出每个临床特征所对应的第一链路,以及每个最佳标准临床特征所对应的第二链路。3.根据权利要求2所述的方法,其特征在于,分别计算每个临床特征与对应最佳标准临床特征链路的离散增量的方法包括:分别计算每个共处根节点中的第一链路对应的离散量,以及每条第二链路对应的离散量;针对共有节点的第一链路与第二链路,计算所述第一链路和所述第二链路对应的离散增量;遍历包括共有节点的每一条第一链路及每一条第二链路,分别计算任意第一链路与任意第二链路对应的离散增量。4.根据权利要求3所述的方法,其特征在于,针对共有节点的第一链路与第二链路,计算所述第一链路和所述第二链路对应的离散增量的方法包括:获取第一链路与第二链路中共有节点的数量第一链路中所有节点的数量第一链路中每个共有节点对单基因病的贡献度总和第一链路中的特征集合与特征集合A的Jaccard距离第一链路中的特征集合与特征集合A的富集显著性值
采用公式计算第j个临床特征在第一链路中的离散增量,所述I
j
表示第j个临床特征;获取第一链路与第二链路中共有节点的数量第二链路中所有节点的数量第二链路中每个共有节点对单基因病的贡献度总和第二链路中的特征集合与特征集合A的Jaccard距离第二链路中的特征集合与特征集合A的富集显著性值采用公式计算第j个最佳标准临床特征在第二链路中的离散增量,所述A
j
表示第j个最佳标准临床特征。5.根据权利要求4所述的方法,其特征在于,累加得到特征集合I与第n个单基因病名称中对应最佳标准临床特征的总离散增量的方法包括:采用公式计算特征集合I与第n个单基因病名称的...

【专利技术属性】
技术研发人员:马旭陈翠霞曹宗富蔡瑞琨李乾殷哲
申请(专利权)人:国家卫生健康委科学技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1