The invention discloses a drug adverse event information extraction method based on social network data, which includes the following steps: grabbing drug feedback text from patients in social network; preprocessing comment text; parsing comment text; recognizing predicates in comment text; recognizing predicates'dominant subjective semantic roles in comment text. Computing degree value; Filling in the template of adverse drug events. The invention is suitable for extracting information of adverse drug events, with unlimited types of drugs, can effectively analyze feedback information of patients after medication, provide consultation for drug production, operation, use and management of drug administration departments, and is conducive to business development and management improvement.
【技术实现步骤摘要】
一种基于社交网络数据的药品不良事件信息提取方法
本专利技术属于信息抽取
,具体地说,涉及一种基于社交网络数据的药品不良事件信息提取方法。技术背景药品不良事件(adversedrugevent,简称ADE)是指服用药物治疗疾病过程中所发生的不幸的医疗卫生事件,是由药物引起或与药物相关的患者机体损害。药品不良事件的原因包括药品标准缺陷、药品不良反应、药品质量问题、药品滥用以及用药失误。在概念范围上药品不良事件大于药品不良反应,有些药品不良事件不一定与药物治疗存在因果关系。在涉及的机构和人群方面,药品不良事件涉及到生产和研究者、监管者、流通商、医生、护士、药师、患者或消费者。本着“可疑即报”的原则,将传统的药品不良反应监测延伸至药品不良事件监测,对用药期间出现的各种医学事件都进行监督,可以更大程度地降低用药风险。尽管药品上市前会进行临床实验分析,医院在临床使用过程中也有相应的集中监测上报制度,但是受到时间、检测对象等限制,,数据代表性差,得出的分析结果无法覆盖所有的药品不良事件,导致药品不良事件被低报或漏报,从而造成无法全面认知药品副作用和安全性注意事项。因此,利用社交网络数据提取药品不良事件信息可以作为现有药物不良事件呈报系统的补充,作为药品安全性和有效性管理工作的重要参考,具有重要的理论价值和现实意义。
技术实现思路
本专利技术的技术解决方案:一种基于社交网络数据的药品不良事件信息提取方法,包括以下基本步骤:从社交网络中抓取网上患者对药物评论文本,以字符形式存储,并对获取的药物评论文本数据进行预处理;根据依存语法体系,对评论文本进行句法分析,将句法结构 ...
【技术保护点】
1.一种基于社交网络数据的药品不良事件信息提取方法,其特征在于,包括:从社交网络中抓取网上患者对药物评论文本,以字符形式存储,并对获取的药物评论文本数据进行预处理;根据依存语法体系,对评论文本进行句法分析,将句法结构描述为一个支配词及其从属成分构成的树结构,并标注主语、谓语、定语的依存关系;其中,所述支配词是谓语中心语;确定依存句法结构中每一药物评论文本中处于支配地位的谓词,对谓词进行语义类识别,并依据预设规则标注谓词所支配的主体语义角色;其中,所述主体语义角色是从属于谓词的名词性短语、且在语义关系上是动作行为或性状描述的主体;依据对药物评价文本的标注情况,确定药物评价描述的程度值,并将程度值填充入药品不良事件模板。
【技术特征摘要】
1.一种基于社交网络数据的药品不良事件信息提取方法,其特征在于,包括:从社交网络中抓取网上患者对药物评论文本,以字符形式存储,并对获取的药物评论文本数据进行预处理;根据依存语法体系,对评论文本进行句法分析,将句法结构描述为一个支配词及其从属成分构成的树结构,并标注主语、谓语、定语的依存关系;其中,所述支配词是谓语中心语;确定依存句法结构中每一药物评论文本中处于支配地位的谓词,对谓词进行语义类识别,并依据预设规则标注谓词所支配的主体语义角色;其中,所述主体语义角色是从属于谓词的名词性短语、且在语义关系上是动作行为或性状描述的主体;依据对药物评价文本的标注情况,确定药物评价描述的程度值,并将程度值填充入药品不良事件模板。2.根据权利要求1所述的基于社交网络数据的药品不良事件信息提取方法,其特征在于,在从社交网络中抓取网上患者对药物评论文本的步骤中,是利用爬虫技术从博客、微博、在线评论的社交网络中抓取。3.根据权利要求1所述的基于社交网络数据的药品不良事件信息提取方法,其特征在于,在对获取的用药物评论文本数据进行预处理的步骤中,预处理的步骤包括:识别药物评论文本对应的评论者名称和URL标识,对药物评论文本进行分词和词性标注,识别药物评价文本中包含的药品名称;对药物评论文本进行断句处理,以“,?!。”为标志,将文本切分为语块;将药品名及其对应的评论语块存储于数据库。4.根据权利要求3所述的基于社交网络数据的药品不良事件信息提取方法,其特征在于,在确定依存句法结构中每一药物评论文本中处于支配地位的谓词的步骤中,谓词包括形容词、动词、成语和习用语,其句法功能包括主谓结构的谓语、述宾结构的述语、述补结构的补语和定中结构的中心语;对谓词进行语义类识别是根据语义分类词典进行识别。5.根据权利要求4所述的基于社交网络数据的药品不良事件信息提取方法,其特征在于,在依据预设规则标注谓词所支配的主体语义角色的步骤中,预设规则为:若药物评价文本只有一个谓词,则不标注语义角色;若药物评价文本的句法结构为“谓词-->词1”,且词1之前没有其他定语依存成分,且词1与谓词的句法关系为主谓,则标注词1为主体;若药物评价文本的句法结构为“谓词-->词1”,且词1前有定语依存成分,即“词1-->词2,词2-->词3……”,则将“词3词2词1……”整个序列标注为主体;若药物评价文本...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。