一种基于分层策略的药品不良反应数据遮蔽效应消除方法技术

技术编号:19010407 阅读:68 留言:0更新日期:2018-09-22 10:07
本发明专利技术公开了一种基于分层策略的药品不良反应数据遮蔽效应消除方法,所述方法以中国药品不良反应(ADR)报告数据为基础,研究药品不良反应信号检测中数据遮蔽效应的消除方法,设计了基于分层策略的数据遮蔽效应消除模型,根据报告数据中药品、不良反应以及药品‑不良反应对出现的频次对数据总体进行分层,并对分层后的数据采用IC方法进行信号检测。发明专利技术中将出现频次处于同一数量级的报告分到同一层次,有效解决了因出现次数差别过大而导致的数据遮蔽效应,从而最大限度地消除数遮蔽效应。本发明专利技术能够准确可靠地检测出药品不良反应报告中的可疑信号,在临床医疗、药品监管环节有重要的参考意义。

A hierarchical strategy based method for eliminating the shadowing effect of adverse drug reaction data

The invention discloses a method for eliminating the masking effect of ADR data based on the stratified strategy. The method is based on the ADR report data of China, studies the method for eliminating the masking effect of data in the detection of ADR signals, and designs a data masking effect eliminating model based on the stratified strategy. According to the reported data of drugs, adverse reactions and adverse drug reactions, the frequency of occurrence of the data was stratified, and the stratified data were detected by IC method. The invention divides the reports of the same order of magnitude into the same level, and effectively solves the data masking effect caused by the excessive difference of the occurrence frequency, thereby eliminating the number masking effect to the greatest extent. The method can accurately and reliably detect suspicious signals in adverse drug reaction reports, and has important reference significance in clinical medicine and drug supervision.

【技术实现步骤摘要】
一种基于分层策略的药品不良反应数据遮蔽效应消除方法
本专利技术属于信号检测领域,具体涉及一种基于分层策略用于我国药品不良反应信号检测中数据遮蔽效应消除的方法。
技术介绍
目前,随着人们生活水平的提高,人们在关注医疗用药的同时,越来越多地会关注用药安全问题。国内外对于药品不良反应信号检测的研究开始于20世纪50年代的“反应停”事件。我国的信号检测工作主要通过中国自发呈报数据库收集ADR数据并对收集到的海量监测数据进行数据挖掘。信号检测领域被广泛使用的方法是不相称测定法,以四格表为基础,计算数据库中数据分布的不均衡。而由于遮蔽效应的存在,仅仅基于不相称测定理论对数据进行信号检测,并不能挖掘出药品与不良反应之间的潜在联系,故需要采取一定的策略进行遮蔽效应的消除。关于药品不良反应信号检测中数据遮蔽效应的消除,国内外学者曾做过一些相关的研究,主要采用的是基于数据移除的方法、基于数学模型的回归方法、协变量分层方法等,但由于我国的ADR数据存在着大量漏报、误报,以及报告组合形式众多等特点,当前我国药品不良反应的数据遮蔽效应消除领域尚未形成统一方法,如何去除遮蔽效应以提高信号检测准确性是目前研究的热点问题。
技术实现思路
本专利技术的目的在于:针对上述现有技术存在的问题,本专利技术从ADR信号检测过程中数据遮蔽效应产生的原因入手,对预处理后的数据整体进行等频分层处理,再利用IC方法进行信号检测,有效地削减了由于不同的药品-不良反应对之间出现频次差异过大而导致的数据遮蔽效应。为了达到以上目的,本专利技术提供的一种基于分层策略的药品不良反应信号检测中数据遮蔽效应的消除方法,所述方法包括以下步骤:1)ADR数据的采集与预处理:其中ADR数据的采集包括原始ADR数据采集并建立原始ADR数据库以及已知数据的采集建立已知库,数据的预处理是指将原始ADR报告中多药品、多不良反应的报告拆分为一对一的单一对应关系,删除数据中药品名称或不良反应名称为“不详”的记录以及出现频次小于3的ADR报告数据;2)数据的分层处理:将步骤1处理后的ADR数据库中所含的药品不良反应报告,对预处理后的ADR数据进行了分层处理;3)数据的信号检测:对分层前后的数据,通过ADR信号检测方法进行信号检测;4)数据遮蔽效应消除有效性评价:借助已知数据库来判断分层前后信号检测的效果,采用精度Precision、召回率Recall以及F度量作为评价指标。其中,所述原始ADR数据库为国家中心的ADR数据,已知数据库包含了目前已知药品及其对应的不良反应,数据采集为原始ADR数据从国家药品不良反应监测中心获得;所参考的已知数据库是从网络中采集了相关药物说明书、国家食品药品监督管理局发布的各期药品不良反应信息通报以及药物警戒快讯和各种法规文件等来建立的ADR数据库,其中包含了目前已知的药品及其导致的不良反应。优选的,在步骤2)数据的分层处理步骤中,所述的数据的分层处理程序,是根据所拥有的数据规模从药品出现频次、不良反应出现频次、药品不良反应对的出现频次三个层面对数据进行等频的分层处理,最终分为27组数据集,保证每组数据中药品-不良反应对出现的频次均处于同一个数量级上。步骤2)数据的分层处理:2.1按照药品出现频次分层:依据ADR报告数据,利用MicrosoftVisualFoxPro(6.0)对每种药品出现的频次进行数据分布统计,根据出现频次以及报告总体数量,对数据进行等频(等深)分3层,使得每层中所拥有的报告数量大致相等,将分层后的数据集记为DrugGroup1、DrugGroup2、DrugGroup3;2.2按照不良反应出现频次分层:对步骤2.1中所述三层,分别进行不良反应出现频次的数据分布统计,根据ADR出现频次以及该层次的报告总数,再次对数据进行等频分3层,使得每层中所拥有的报告数量大致相等,最终DrugGroup1按照不良反应出现频次分为三层,记为ADRGroup1-1、ADRGroup1-2、ADRGroup1-3,类似地DrugGroup2和DrugGroup3按照不良反应出现频次区间,分为ADRGroup2-1、ADRGroup2-2、ADRGroup2-3和ADRGroup3-1、ADRGroup3-2、ADRGroup3-3;2.3按照药品-不良反应对出现频次分层:经过2.1以及2.2步骤的分层,此时已经得到了9组数据集。最后在这9组数据中进行药品-不良反应对出现频次的统计,结合各组数据中的报告总量,依次进行等频划分,如此进行下去,最终得到27组数据集,记为Drug-ADRGroup1-1-1、Drug-ADRGroup1-1-2、Drug-ADRGroup1-1-3、……Drug-ADRGroup3-3-1、Drug-ADRGroup3-3-2、Drug-ADRGroup3-3-3优选的,步骤4)数据遮蔽效应消除有效性评价步骤中的有效性评价过程如下:401)信号标注:借助已知数据库中药品-不良反应组合对分层前后信号检测结果进行标注,若该组合在已知库中存在则标注为1,否则标注为0;402)设计基于已知库的列联表:所述列联表元素分别为TP、FN、FP、TN;其中TP代表已知的药品-不良反应信号被准确检测为阳性信号的数量,即真阳性,FN代表已知的药品-不良反应信号被检测为阴性信号的数量,即假阴性,FP表示未知的药品-不良反应信号被检测为阳性信号的数量,即假阳性,TN表示未知的药品-不良反应信号被检测为阴性信号的数量,即真阴性;403)评价指标计算:精度(precision)是精确性度量的指标,即标记为阳性的元组实际为阳性所占的百分比;召回率(recall)是完全性的度量,即阳性元组标记为阳性所占的百分比;精度和召回率之间趋向于呈现逆关系,有可能以降低一个为代价而提高另一个;F度量将精度和召回率组合到一个度量中,定义如下:比较分层前后上述三个指标值的大小,若指标值提高,则说明数据遮蔽效应在一定程度上有所削减,一些可疑的药品-不良反应信号对通过分层的方法被检测出来,反馈给医疗机构、药品监管部门进行进一步地临床验证。优选的,所述步骤3)数据的信号检测中ADR信号检测方法为基于不相称测定理论的IC方法。与现有技术相比,本专利技术的有益效果为:①本专利技术以中国ADR报告数据为基础,研究ADR信号检测过程中数据遮蔽效应的消除问题,提出了基于分层策略的数据遮蔽效应的消除方法。②本专利技术从数据库整体中药品出现频次、不良反应出现频次、药品-不良反应对出现频次三个方面入手,对总体数据分层处理,对每组数据采用IC方法进行信号检测,信号检测效果有显著提高。③本专利技术可以挖掘出未知的可疑药品-不良反应对,在临床医疗、药品监管环节有重要的参考意义,为中国药品不良反应信号检测过程中数据遮蔽效应的消除问题提供了一种可参考的方法。附图说明图1为分层策略流程图;图2为ADR报告数据分层示意图。具体实施方式下面的实施例可使本专业技术人员更全面地理解本专利技术,但不以任何方式限制本专利技术。实施例11ADR数据的采集与预处理1.1原始ADR数据采集处理从国家药品不良反应检测中心获得2010.1.1~2011.12.31两年间ADR报告数据共1823144条,其中有608710条报告记录存在多药品、多不良反应的多重对应关本文档来自技高网...
一种基于分层策略的药品不良反应数据遮蔽效应消除方法

【技术保护点】
1.一种基于分层策略的药品不良反应信号检测中数据遮蔽效应的消除方法,其特征在于,所述方法包括以下步骤:1)ADR数据的采集与预处理:其中ADR数据的采集包括原始ADR数据采集并建立原始ADR数据库以及已知数据的采集建立已知库,数据的预处理是指将原始ADR报告中多药品、多不良反应的报告拆分为一对一的单一对应关系,删除数据中药品名称或不良反应名称为“不详”的记录以及出现频次小于3的ADR报告数据;2)数据的分层处理:将步骤1处理后的ADR数据库中所含的药品不良反应报告,对预处理后的ADR数据进行了分层处理;3)数据的信号检测:对分层前后的数据,通过ADR信号检测方法进行信号检测;4)数据遮蔽效应消除有效性评价:借助已知数据库来判断分层前后信号检测的效果,采用精度Precision、召回率Recall以及F度量作为评价指标。

【技术特征摘要】
1.一种基于分层策略的药品不良反应信号检测中数据遮蔽效应的消除方法,其特征在于,所述方法包括以下步骤:1)ADR数据的采集与预处理:其中ADR数据的采集包括原始ADR数据采集并建立原始ADR数据库以及已知数据的采集建立已知库,数据的预处理是指将原始ADR报告中多药品、多不良反应的报告拆分为一对一的单一对应关系,删除数据中药品名称或不良反应名称为“不详”的记录以及出现频次小于3的ADR报告数据;2)数据的分层处理:将步骤1处理后的ADR数据库中所含的药品不良反应报告,对预处理后的ADR数据进行了分层处理;3)数据的信号检测:对分层前后的数据,通过ADR信号检测方法进行信号检测;4)数据遮蔽效应消除有效性评价:借助已知数据库来判断分层前后信号检测的效果,采用精度Precision、召回率Recall以及F度量作为评价指标。2.根据权利要求1所述的一种基于分层策略的药品不良反应数据遮蔽效应消除方法,其特征在于:在步骤2)数据的分层处理步骤中,所述的数据的分层处理程序,是根据所拥有的数据规模从药品出现频次、不良反应出现频次、药品不良反应对的出现频次三个层面对数据进行等频的分层处理,最终分为27组数据集,保证每组数据中药品-不良反应对出现的频次均处于同一个数量级上。3.根据权利要求1或2所述的一种基于分层策略的药品不良反应数据遮蔽效应消除方法,其特征在于:所述步骤2)数据的分层处理:2.1)按照药品出现频次分层:依据ADR报告数据,利用MicrosoftVisualFoxPro(6.0)对每种药品出现的频次进行数据分布统计,根据出现频次以及报告总体数量,对数据进行等频(等深)分3层,使得每层中所拥有的报告数量大致相等,将分层后的数据集记为DrugGroup1、DrugGroup2、DrugGroup3;2.2)按照不良反应出现频次分层:对步骤2.1)中所述三层,分别进行不良反应出现频次的数据分布统计,根据ADR出现频次以及该层次的报告总数,再次对数据进行等频分3层,使得每层中所拥有的报告数量大致相等,最终DrugGroup1按照不良反应出现频次分为三层,记为ADRGroup1-1、ADRGroup1-2、ADRGroup1-3,类似地DrugGroup2和DrugGroup3按照不良反应出现频次区间,分为ADRGroup2-1、ADRGroup2-2、ADRGroup2-3和ADRGroup3-1、ADRGroup3-2、ADRGroup3-3;2.3)按照药品-不良反应对出现频次分层:经过2.1)以及2.2)...

【专利技术属性】
技术研发人员:魏建香丁玥倪霏朱云霞
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1