【技术实现步骤摘要】
单基因病名称的推荐方法和系统
[0001]本专利技术涉数字医疗
,尤其涉及一种单基因病名称的推荐方法和系统。
技术介绍
[0002]出生缺陷又称先天缺陷,是指由于先天性、遗传性和不良环境等原因引起的出生时的各种结构性畸形和功能性异常的总称。全国出生缺陷率高达5.6%,我国年出生人口1600
‑
2000万,每年新增出生缺陷数约为90万例,其中出生时临床明显可见的出生缺陷约有25万例,部分出生缺陷发生率呈上升态势。出生缺陷按照病因学分类可以分为三类:一是遗传因素引起的,包括染色体异常和单基因病突变;二是环境因素引起的,包括理化生物和生活方式等方面;三是遗传和环境因素共同作用导致。
[0003]除了染色体疾病,单基因病是引起出生缺陷最主要的遗传学病因。单基因遗传病是指疾病的发生主要受一个基因座上的基因控制,由于单个基因的突变而引起的遗传病,又称孟德尔遗传病。它的遗传方式遵循孟德尔定律,突变既可来自父母,也可源于自身,都有遗传给下一代的可能。它是由一对等位基因突变导致的疾病,又称孟德尔式遗传病,由于我国人口基数大,总数已近千万,已经对人口健康构成了较大的威胁。根据世界卫生组织WHO统计,在全球出生人口中所有单基因遗传病的累计发病率高达10%。单基因遗传病危害严重,大多数会致畸,致残甚至致死,缺乏有效治疗手段。
[0004]单基因病存在如下复杂的特点:1、单基因病种类繁多,目前OMIM数据库中记录的已经超过8000种,总发病率也高达1%以上;2、单基因病表型复杂,同一种单基因病表型异质性
【技术保护点】
【技术特征摘要】
1.一种单基因病名称的推荐方法,其特征在于,包括:根据单基因病名称的特征关系数据库,构建单基因病的标准化临床特征表型树;将用户输入的特征集合I中的临床特征在标准化临床特征表型树上的节点标记;遍历特征关系数据库中的第n个单基因病名称,将其对应特征集合A中的标准临床特征在标准化临床特征表型树上的节点标记,所述n的初始值为1;基于标准化临床特征表型树上的节点标记,从特征集合A中匹配出与特征集合I每个临床特征一一对应的最佳标准临床特征;根据共处根节点的临床特征与最佳标准临床特征的链路分布,分别计算每个临床特征与对应最佳标准临床特征链路的离散增量,并累加得到特征集合I与第n个单基因病名称中对应最佳标准临床特征的总离散增量;令n=n+1重新遍历特征关系数据库中的第n个单基因病名称,直至特征关系数据库中的单基因病名称遍历完毕,将特征集合I与每个特征集合A对应的总离散增量汇总排序,输出最小总离散增量对应的单基因病名称。2.根据权利要求1所述的方法,其特征在于,链路分布的获取方法包括:所述特征集合I包括多个临床特征,所述特征集合A包括多个标准临床特征;遍历所述特征集合I中的第i个临床特征,从所述特征集合A中匹配出与所述第i个临床特征对应的标准临床特征,作为与所述第i个临床特征对应的最佳标准临床特征,所述i的初始值为1;令i=i+1后重新遍历所述特征集合I中的第i个临床特征,直至特征集合I中的临床特征遍历完毕,从第n个单基因病名称对应的特征集合A中筛选出与特征集合I中临床特征一一对应的多个最佳标准临床特征;将所述特征集合I中的全部临床特征,以及特征集合A中一一对应的最佳标准临床特征在标准化临床特征表型树上做节点标记,统计出每个临床特征所对应的第一链路,以及每个最佳标准临床特征所对应的第二链路。3.根据权利要求2所述的方法,其特征在于,分别计算每个临床特征与对应最佳标准临床特征链路的离散增量的方法包括:分别计算每个共处根节点中的第一链路对应的离散量,以及每条第二链路对应的离散量;针对共有节点的第一链路与第二链路,计算所述第一链路和所述第二链路对应的离散增量;遍历包括共有节点的每一条第一链路及每一条第二链路,分别计算任意第一链路与任意第二链路对应的离散增量。4.根据权利要求3所述的方法,其特征在于,针对共有节点的第一链路与第二链路,计算所述第一链路和所述第二链路对应的离散增量的方法包括:获取第一链路与第二链路中共有节点的数量第一链路中所有节点的数量第一链路中每个共有节点对单基因病的贡献度总和第一链路中的特征集合与特征集合A的Jaccard距离第一链路中的特征集合与特征集合A的富集显著性值
采用公式计算第j个临床特征在第一链路中的离散增量,所述I
j
表示第j个临床特征;获取第一链路与第二链路中共有节点的数量第二链路中所有节点的数量第二链路中每个共有节点对单基因病的贡献度总和第二链路中的特征集合与特征集合A的Jaccard距离第二链路中的特征集合与特征集合A的富集显著性值采用公式计算第j个最佳标准临床特征在第二链路中的离散增量,所述A
j
表示第j个最佳标准临床特征。5.根据权利要求4所述的方法,其特征在于,累加得到特征集合I与第n个单基因病名称中对应最佳标准临床特征的总离散增量的方法包括:采用公式计算特征集合I与第n个单基因病名称的...
【专利技术属性】
技术研发人员:马旭,陈翠霞,曹宗富,蔡瑞琨,李乾,殷哲,
申请(专利权)人:国家卫生健康委科学技术研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。