一种从社交媒体中自动发掘不良药物反应的方法技术

技术编号:29401521 阅读:19 留言:0更新日期:2021-07-23 22:39
本发明专利技术涉及药物信息发掘应用技术领域,且公开了一种从社交媒体中自动发掘不良药物反应的方法。该从社交媒体中自动发掘不良药物反应的方法,使用一种半监督的机器学习框架,从自然语言文本中提取句法特征,以识别药物和与之正相关的不良反应,其关键贡献在于引入了一种几乎不需要手动注释的自动标签生成算法,因此该方法也具有更广的适应性。通过手动标记的测试集与其它可选方法的分类检测效果相比较,该方法在保证精确度的同时具有更好的稳定性,此外,该方法侧重于在中文信息中检索不良药物反应信息,既可以检测已知不良反应在特定人群中的发生频率又可以发掘未知的不良反应信息,从而在深度和广度上扩大对不良药物反应的认知。

【技术实现步骤摘要】
一种从社交媒体中自动发掘不良药物反应的方法
本专利技术涉及药物信息发掘应用
,具体为一种从社交媒体中自动发掘不良药物反应的方法。
技术介绍
明确不良药物反应(ADR,AdverseDrugReaction)是药物研发的一个重点,但上市前的临床实验往往会受到受试者人数,研究时间和制药公司以及患者经济压力等的限制,近年来的一些研究也试图用药物的化学结构、靶点蛋白或者药物研发周期中的治疗指征等,对药物的不良反应进行预测,然而,某些药物的新不良反应只有在上市后,在不同的人种中或伴有不同疾病的人群中被广泛使用后,才会被认知,又或者某些不良反应要经过一段较长时间的积累才会显现,而这个时间跨度甚至可能超出该药物的研发周期,为避免事故的发生,药品监管部门和制药公司都不惜付出巨大努力和代价去进行上市后的四期临床实验以计算机为基础在现有的数据资源中发掘不良药物反应的研究,也成为对昂贵的四期临床实验的一种有效的补充。近年来,越来越多的研究旨在从各种数据资源中发掘药物的不良反应,随着数据资源的不同(可以是结构化也可以是非结构化的文本),使用的挖掘方法也不本文档来自技高网...

【技术保护点】
1.一种从社交媒体中自动发掘不良药物反应的方法,其特征在于,包括以下步骤:/n1)、构建药物和不良反应词汇库,其中包括药物和不良药物反应的正规或者专业名称,以及用它们的同音词或者口语化词汇进行扩充的词汇组;/n2)、在中文社交媒体中,选取包含感兴趣药物的帖子,对它们进行分词处理,再根据步骤1)中构件的词汇库,提取药物与候选不良反应组合,以及该组合所在的文本证据;/n3)、用半监督的支持向量机(SVM)模型作为分类器对步骤2)中药物与不良反应的组合以及它们所在的文本证据进行分类,判断是否为有效组合,以及判断有效组合所在的文本证据是正例还是反例;/n4)、将步骤3)分出的正例中的候选不良药物反应进...

【技术特征摘要】
1.一种从社交媒体中自动发掘不良药物反应的方法,其特征在于,包括以下步骤:
1)、构建药物和不良反应词汇库,其中包括药物和不良药物反应的正规或者专业名称,以及用它们的同音词或者口语化词汇进行扩充的词汇组;
2)、在中文社交媒体中,选取包含感兴趣药物的帖子,对它们进行分词处理,再根据步骤1)中构件的词汇库,提取药物与候选不良反应组合,以及该组合所在的文本证据;
3)...

【专利技术属性】
技术研发人员:韦嘉叶翔赟
申请(专利权)人:上海基绪康生物科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1