药物不良反应挖掘方法和系统技术方案

技术编号:13928032 阅读:62 留言:0更新日期:2016-10-28 10:57
本发明专利技术公开了一种药物不良反应挖掘方法和系统,所述方法通过构建药物拓扑相似性矩阵和不良反应拓扑相似性矩阵,根据药物拓扑相似性矩阵和不良反应拓扑相似性矩阵,计算药物与不良反应组合的全局相关度向量,根据全局相关度向量的相似性,计算所有所述药物与不良反应组合的特征向量,再利用局部全局一致性学习算法,将已知的药物与不良反应组合的所述特征向量和与其相似度大于预设值的药物与不良反应组合的所述特征向量进行分类,以确定所述未知的药物与不良反应的组合是否存在对应关系,从而降低了临床用药不良反应发生风险。

【技术实现步骤摘要】

本专利技术涉及数据挖掘
,特别涉及一种药物不良反应挖掘方法和系统
技术介绍
随着制药工业迅猛发展,大量药品不断涌现并得到广泛使用,随之而来的后果是药物不良反应事件数目急剧上升,给患者的身心健康带来了损害。药物不良反应是指药品在预防、诊断、治病或调节生理功能的正常用法用量下,出现的有害的和意料之外的反应。据世界卫生组织(WHO)统计,世界各国因服药而发生药物不良反应的比例约为10%~30%,每年约有超过500万人次因药物不良反应而住院,因药物不良反应而死亡人数达约19.2万人。目前,世界各国基本已建立了药物不良反应定期报告制度。然而,各国对药物不良反应的研究还停留在一般意义的数理统计分析层面,并未做深层次的研究。我国目前对药物不良反应的研究方法多关注药物不良反应发生的频次,无法有效降低临床用药时不良反应发生的风险。
技术实现思路
有鉴于此,本专利技术的目的是提供一种从药品与药物不良反应的关系角度来降低临床用药不良反应发生风险的药物不良反应挖掘方法和系统。为了实现上述目的,本专利技术提供了一种药物不良反应挖掘方法,包括:S1,根据药物数据,基于药物之间的拓扑相似性构建药物拓扑相似性矩阵;其中,所述药物数据由药物不良反应报告中获取;S2,根据不良反应数据,基于不良反应数据之间的拓扑相似性构建不良反应拓扑相似性矩阵;其中,所述不良反应数据由所述药物不良反应报告中获取;S3,根据所述药物拓扑相似性矩阵和不良反应拓扑相似性矩阵,基于图的相关度计算药物与不良反应组合的全局相关度向量,其中,所述药物与不良反应组合包括已知的药物与不良反应组合和未知的药物与不良反应组合;S4,根据所有所述药物与不良反应组合的全局相关度向量与所述已知的药物与不良反应组合的全局相关度向量的相似性,计算所有所述药物与不良反应组合的特征向量;S5,利用局部全局一致性学习算法,将已知的药物与不良反应组合的所述特征向量和与其相似度大于预设值的药物与不良反应组合的所述特征向量进行分类,以确定所述未知的药物与不良反应的组合是否存在对应关系。作为优选,所述步骤S1包括:S101,从所述药物不良反应报告中获取所述药物数据和与所述药物不良反应数据;S102,根据所获取的所述药物数据构建药物共享度相似矩阵,其中,所述药物共享度相似矩阵的元素由所述药物和所述药物所对应的不良反应个数组成;S103,以所述药物共享度相似矩阵作为图的邻接矩阵,计算每个药物节点与所有节点的最短距离组成所述药物节点的最短路径向量,以得到所有所述药物节点的最短路径向量集合;S104,构建药物拓扑相似性矩阵,其中所述药物拓扑相似性矩阵的元素为所述最短路径向量集合元素的皮尔森相关系数绝对值。作为优选,所述步骤S2包括:S201,根据所述药物数据和不良反应数据,构建不良反应共享度相似矩阵,其中所述不良反应共享度相似矩阵的元素由不良反应和不良反应所对应的药物个数组成;S202,以所述不良反应共享度相似矩阵作为图的邻接矩阵,计算每个不良反应节点与所有节点的最短距离组成该节点的最短路径向量,以得到所有所述不良反应节点的最短路径向量集合;S203,构建不良反应拓扑相似性矩阵,其中所述不良反应拓扑相似性矩阵的元素为所述最短路径向量集合中元素的皮尔森相关系数绝对值。作为优选,所述步骤S3包括:S301,计算药物与不良反应组合的全局相关度向量;S302,重复执行S301,以得到所有所述药物与不良反应组合的全局相关度向量。作为优选,所述步骤S4包括:S401,将所述药物与不良反应组合的全局相关度向量组成的集合分为具有确定因果关系的第一子集和不具有确定因果关系的第二子集;S402,计算所述药物与不良反应组合的全局相关度向量组成的集合的元素与所述第一子集的元素的相似度。作为优选,所述步骤S5包括:S501,将所述第一子集的元素标记为第一类别;S502,将属于所述第二子集的、且与所述第一子集的元素的相似度小于预设阈值的元素标记为第二类别;S503,将所述第二子集中除标记为第二类别以外的元素使用局部全局一致性学习算法进行分类。本专利技术还提供一种药物不良反应挖掘系统,包括:第一构建模块,用于根据药物数据,基于药物之间的拓扑相似性构建药物拓扑相似性矩阵;其中,所述药物数据由药物不良反应报告中获取;第二构建模块,用于根据不良反应数据,基于不良反应数据之间的拓扑相似性构建不良反应拓扑相似性矩阵;其中,所述不良反应数据由药物不良反应报告中获取;第一计算模块,用于根据所述药物拓扑相似性矩阵和不良反应拓扑相似性矩阵,基于图的相关度计算药物与不良反应组合的全局相关度向量,其中,所述药物与不良反应组合包括已知的药物与不良反应组合和未知的药物与不良反应组合;第二计算模块,用于根据所有所述药物与不良反应组合的全局相关度向量与所述已知的药物与不良反应组合的全局相关度向量的相似性,计算所有所述药物与不良反应组合的特征向量;输出模块,用于利用局部全局一致性学习算法,将已知的药物与不良反应组合的所述特征向量和与其相似度大于预设值的药物与不良反应组合的所述特征向量进行分类,以确定所述未知的药物与不良反应的组合是否存在对应关系。作为优选,所述第一构建模块包括:第一获取子模块,用于从所述药物不良反应报告中获取所述药物数据和与所述药物相对应的药物不良反应数据;第一构建子模块,用于根据所获取的所述药物数据构建药物共享度相似矩阵,其中,所述药物共享度相似矩阵的元素由所述药物和所述药物所对应的不良反应个数组成;第一计算子模块,用于以所述药物共享度相似矩阵作为图的邻接矩阵,计算每个药物节点与所有节点的最短距离组成所述药物节点的最短路径向量,以得到所有所述药物节点的最短路径向量集合;第二构建子模块,用于构建药物拓扑相似性矩阵,其中所述药物拓扑相似性矩阵的元素为所述最短路径向量集合元素的皮尔森相关系数绝对值。作为优选,所述第二构建模块包括:第三构建子模块,用于根据所述药物数据和不良反应数据,构建不良反应共享度相似矩阵,其中所述不良反应共享度相似矩阵的元素由不良反应和不良反应所对应的药物个数组成;第二计算子模块,用于以所述不良反应共享度相似矩阵作为图的邻接矩阵,计算每个不良反应节点与所有节点的最短距离组成该节点的最短路径向量,以得到所有所述不良反应节点的最短路径向量集合;第四构建子模块,用于构建不良反应拓扑相似性矩阵,其中所述不良反应拓扑相似性矩阵的元素为所述最短路径向量集合中元素的皮尔森相关系数绝对值。作为优选,所述第一计算模块包括:第三计算子模块,用于计算药物与不良反应组合的全局相关度向量;执行子模块,用于重复执行计算药物与不良反应组合的全局相关度向量的步骤,以得到所有所述药物与不良反应组合的全局相关度向量。与现有技术相比,本专利技术具有以下有益效果:本专利技术的技术方案通过构建药物拓扑相似性矩阵和不良反应拓扑相似性矩阵,根据药物拓扑相似性矩阵和不良反应拓扑相似性矩阵,计算药物与不良反应组合的全局相关度向量,根据全局相关度向量的相似性,计算所有所述药物与不良反应组合的特征向量,再利用局部全局一致性学习算法,将已知的药物与不良反应组合的所述特征向量和与其相似度大于预设值的药物与不良反应组合的所述特征向量进行分类,以确定所述未知的药物与不良反应的组合是否存在对应关系,从而本文档来自技高网...

【技术保护点】
一种药物不良反应挖掘方法,其特征在于,包括:S1,根据药物数据,基于药物之间的拓扑相似性构建药物拓扑相似性矩阵;其中,所述药物数据由药物不良反应报告中获取;S2,根据不良反应数据,基于不良反应数据之间的拓扑相似性构建不良反应拓扑相似性矩阵;其中,所述不良反应数据由所述药物不良反应报告中获取;S3,根据所述药物拓扑相似性矩阵和不良反应拓扑相似性矩阵,基于图的相关度计算药物与不良反应组合的全局相关度向量,其中,所述药物与不良反应组合包括已知的药物与不良反应组合和未知的药物与不良反应组合;S4,根据所有所述药物与不良反应组合的全局相关度向量与所述已知的药物与不良反应组合的全局相关度向量的相似性,计算所有所述药物与不良反应组合的特征向量;S5,利用局部全局一致性学习算法,将已知的药物与不良反应组合的所述特征向量和与其相似度大于预设值的药物与不良反应组合的所述特征向量进行分类,以确定所述未知的药物与不良反应的组合是否存在对应关系。

【技术特征摘要】
1.一种药物不良反应挖掘方法,其特征在于,包括:S1,根据药物数据,基于药物之间的拓扑相似性构建药物拓扑相似性矩阵;其中,所述药物数据由药物不良反应报告中获取;S2,根据不良反应数据,基于不良反应数据之间的拓扑相似性构建不良反应拓扑相似性矩阵;其中,所述不良反应数据由所述药物不良反应报告中获取;S3,根据所述药物拓扑相似性矩阵和不良反应拓扑相似性矩阵,基于图的相关度计算药物与不良反应组合的全局相关度向量,其中,所述药物与不良反应组合包括已知的药物与不良反应组合和未知的药物与不良反应组合;S4,根据所有所述药物与不良反应组合的全局相关度向量与所述已知的药物与不良反应组合的全局相关度向量的相似性,计算所有所述药物与不良反应组合的特征向量;S5,利用局部全局一致性学习算法,将已知的药物与不良反应组合的所述特征向量和与其相似度大于预设值的药物与不良反应组合的所述特征向量进行分类,以确定所述未知的药物与不良反应的组合是否存在对应关系。2.根据权利要求1所述的方法,其特征在于,所述步骤S1包括:S101,从所述药物不良反应报告中获取所述药物数据和与所述药物不良反应数据;S102,根据所获取的所述药物数据构建药物共享度相似矩阵,其中,所述药物共享度相似矩阵的元素由所述药物和所述药物所对应的不良反应个数组成;S103,以所述药物共享度相似矩阵作为图的邻接矩阵,计算每个药物节点与所有节点的最短距离组成所述药物节点的最短路径向量,以得到所有所述药物节点的最短路径向量集合;S104,构建药物拓扑相似性矩阵,其中所述药物拓扑相似性矩阵的元素为所述最短路径向量集合元素的皮尔森相关系数绝对值。3.根据权利要求1所述的药物不良反应挖掘方法,其特征在于,所述步骤S2包括:S201,根据所述药物数据和不良反应数据,构建不良反应共享度相似矩阵,其中所述不良反应共享度相似矩阵的元素由不良反应和不良反应所对应的药物个数组成;S202,以所述不良反应共享度相似矩阵作为图的邻接矩阵,计算每个不良反应节点与所有节点的最短距离组成该节点的最短路径向量,以得到所有所述不良反应节点的最短路径向量集合;S203,构建不良反应拓扑相似性矩阵,其中所述不良反应拓扑相似性矩阵的元素为所述最短路径向量集合中元素的皮尔森相关系数绝对值。4.根据权利要求2或3所述的药物不良反应挖掘方法,其特征在于,所述步骤S3包括:S301,计算药物与不良反应组合的全局相关度向量;S302,重复执行S301,以得到所有所述药物与不良反应组合的全局相关度向量。5.根据权利要求4所述的药物不良反应挖掘方法,其特征在于,所述步骤S4包括:S401,将所述药物与不良反应组合的全局相关度向量组成的集合分为具有确定因果关系的第一子集和不具有确定因果关系的第二子集;S402,计算所述药物与不良反应组合的全局相关度向量组成的集合的元素与所述第一子集的元素的相似度。6.根据权利要求5所述的药物不良反应挖掘方法,其特征在于,所述步骤S5包括:S501,...

【专利技术属性】
技术研发人员:黄亦谦
申请(专利权)人:北京千安哲信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1