识别不良事件的方法、装置、设备及介质制造方法及图纸

技术编号:28377484 阅读:16 留言:0更新日期:2021-05-08 00:05
本公开提供了一种识别不良事件的方法、装置、设备及介质,其中,所述方法包括:选择性地从一个或多个数据源获取待识别的文本;根据所述文本的类型,选择与所述文本的类型对应的识别模型;以及利用选择的识别模型,对所述文本执行语义识别以识别所述文本中的不良事件。本公开提供的识别不良事件的方法可以根据不用的文本类型选择不同的识别模型,然后根据选择的识别模型对待识别文本进行相应的不良事件识别,无需人工进行筛选识别,避免漏报/迟报不良事件的发生,并且能够及时/准确上报不良事件,从而可以帮助各个制造或使用药物或医疗器械的公司或医院等场所提高不良事件报告的准确性和及时性,实现不良事件识别和上报全流程的节源、提效、赋能等目的。

【技术实现步骤摘要】
识别不良事件的方法、装置、设备及介质
本公开涉及医药领域,更具体地,涉及一种识别不良事件的方法、装置、设备及介质。
技术介绍
近年来,随着法规监管日趋严格,对不良事件(AdverseEvent,AE)报告的要求越来越高。国家药品监督管理局要求药品上市许可人建立健全药品不良事件监测体系并且及时报告不良事件。不良事件逾期未报,可能会导致产品停售,甚至撤销药品批准证明文件。因此,现在各个制药公司要求所有员工在获知不良事件的当天报告至药物警戒部门,以确保产品安全性得到及时评估,保证患者安全。此外,在使用药物或医疗器械等场所(如医院),因妊娠期(母源及父源)药物暴露、哺乳/泌乳期药物暴露、药物过量、药物滥用、误用、超说明书使用伴随不良事件、用药错误、职业暴露、缺乏疗效及疾病进展、暴露于病原体、药物相互作用、医疗器械(故障)、不明原因死亡、自杀或尝试自杀、以及非预期获益等带来的不良事件也越来越多,若上述不良事件不及时和有效地报告至相关的警戒部门,则上述使用药物或医疗器械的场所(如医院)将会面临赔偿、问责甚至关停等巨大风险,同时也难以保证患者或使用者的安全。目前对不良事件的识别均是通过人工筛选的方式进行的,但是随着不良事件的信息的来源越来越复杂化和多样化,对不良事件的人工筛选也越来越需要更多的人员去处理。而现有的人力资源是有限的,因此,当前不良事件报告的合规风险愈加凸显。在上述不良事件的信息来源复杂化和多样化以及人力资源有限的情况下,对避免漏报/迟报AE,及时/准确上报AE的要求也与日俱增。因此,需要一种自动识别不良事件的方法,并且所述方法可以对不同的不良事件来源分别进行识别,以避免漏报/迟报AE,并及时/准确上报AE。
技术实现思路
针对上述问题,本公开提供了一种识别不良事件的方法,并且所述方法可以对不同的不良事件来源分别进行识别,以避免漏报/迟报AE,并及时/准确上报AE,从而可以帮助各个制造或使用药物或医疗器械的公司或医院等场所提高不良事件报告的准确性和及时性,实现AE识别和上报全流程的节源、提效、赋能等目的。本公开实施例提供了一种识别不良事件的方法,包括:选择性地从一个或多个数据源获取待识别的文本;根据所述文本的类型,选择与所述文本的类型对应的识别模型;以及利用选择的识别模型,对所述文本执行语义识别以识别所述文本中的不良事件。根据本公开实施例,其中,所述文本的类型是基于所述文本的长度和/或所述文本的来源确定的。根据本公开实施例,其中,所述根据所述文本的类型,选择与所述文本的类型对应的识别模型,包括:在所述文本的类型是第一类型的情况下,选择第一识别模型,其中,所述第一识别模型包括:分词器、转换器、特征提取器和分类器,其中,所述分词器用于对所述文本中的句子进行分词,所述转换器用于将分词结果转换为向量序列,所述特征提取器用于基于所述向量序列提取语义特征,所述分类器用于基于提取的语义特征判断所述文本中是否包含不良事件。根据本公开实施例,其中,所述分词器包括第一分词器和第二分词器,其中,所述第一分词器用于逐字地对所述文本进行分词,所述第二分词器用于逐词对所述文本进行分词;其中,转换器包括第一转换器和第二转换器,其中,所述第一转换器用于将第一分词器的分词结果转换为字向量序列,所述第二转换器用于将第二分词器的分词结果转换为词向量序列。根据本公开实施例,其中,所述第二分词器用于逐词对所述文本进行分词,包括:根据通用词典与领域专业词典生成的字典树,生成所述文本中的句子中所有分词情况的有向无环图,从而实现逐词对所述文本进行分词。根据本公开实施例,其中,所述利用选择的识别模型,对所述文本执行语义识别以识别所述文本中的不良事件,包括:利用所述第一分词器逐字地对所述文本中的句子进行分词并利用所述第二分词器逐词地对所述文本中的句子进行分词;利用所述第一转换器将所述第一分词器的分词结果转换为字向量序列并利用所述第二转换器将所述第二分词器的分词结果转换为词向量序列;利用所述特征提取器基于所述字向量序列和所述词向量序列提取语义特征;利用所述分类器基于提取的语义特征判断所述文本中是否包含不良事件,其中,在所述文本中不良事件发生的概率大于预定阈值的情况下,确定所述文本中包含不良事件。根据本公开实施例,其中,所述根据所述文本的类型,选择与所述文本的类型对应的识别模型,包括:在所述文本的类型是第二类型的情况下,选择第二识别模型,其中,所述第二识别模型包括:命名实体识别器、不良事件名称识别器、语义角色标识器、语义角色筛选器和事件确定器,其中,所述命名实体识别器用于识别文本中的命名实体,所述不良事件名称识别器用于识别文本中的不良事件名称,所述语义角色标识器用于根据识别出的命名实体和不良事件名称标识出文本的句子中不良事件发生的语义角色,所述语义角色筛选器用于根据标识出的语义角色和预定规则筛选出至少一部分角色,所述事件确定器用于根据筛选出的角色和预定触发词确定文本中是否包含不良事件。根据本公开实施例,其中,所述利用选择的识别模型,对所述文本执行语义识别以识别所述文本中的不良事件,包括:利用所述命名实体识别器识别文本中的命名实体;利用所述不良事件名称识别器识别文本中的不良事件名称;利用所述语义角色标识器根据识别出的命名实体和不良事件名称标识出文本的句子中不良事件发生的语义角色;利用所述语义角色筛选器根据标识出的语义角色和预定规则筛选出至少一部分角色;以及利用所述事件确定器根据筛选出的角色和预定触发词确定文本中是否包含不良事件,其中,在筛选的角色和所述预定触发词满足预设事件三元组的情况下,确定所述文本中包含不良事件。根据本公开实施例,其中,第二识别模型还包括:共指消解器,用于完成所述文本中的共指消解,从而确定药物和不良事件之间的关联关系,其中,所述利用选择的识别模型,在所述文本中识别不良事件,还包括:在利用语义角色标识器根据识别出的命名实体和不良事件名称标识出文本的句子中不良事件发生的语义角色之后,利用所述共指消解器完成所述文本中的共指消解。根据本公开实施例,其中,所述不良事件至少包含以下三要素:对象、诱因和不良结果。根据本公开实施例,其中,还包括:通过预定汇报人反馈关于不良事件的识别结果。根据本公开实施例,其中,所述识别模型是医药领域的识别模型,所述不良事件是医药领域的不良事件。本公开实施例提供了一种识别不良事件的装置,包括:获取模块,被配置为选择性地从一个或多个数据源获取待识别的文本;选择模块,被配置为根据所述文本的类型,选择与所述文本的类型对应的识别模型;以及识别模块,被配置为利用选择的识别模型,对所述文本执行语义识别以识别所述文本中的不良事件。根据本公开实施例,其中,所述文本的类型是基于所述文本的长度和/或所述文本的来源确定的。根据本公开实施例,其中,所述选择模块包括:在所述文本的类型是第一类型的情况下,选择第一识别模型,其中,所述第一识别模型包括:分词器、转换器、特征提取器和分类器,其中,所述分词器用于对所述文本中的句子进行分词本文档来自技高网
...

【技术保护点】
1.一种识别不良事件的方法,包括:/n选择性地从一个或多个数据源获取待识别的文本;/n根据所述文本的类型,选择与所述文本的类型对应的识别模型;以及/n利用选择的识别模型,对所述文本执行语义识别以识别所述文本中的不良事件。/n

【技术特征摘要】
1.一种识别不良事件的方法,包括:
选择性地从一个或多个数据源获取待识别的文本;
根据所述文本的类型,选择与所述文本的类型对应的识别模型;以及
利用选择的识别模型,对所述文本执行语义识别以识别所述文本中的不良事件。


2.如权利要求1所述的方法,其中,所述文本的类型是基于所述文本的长度和/或所述文本的来源确定的。


3.如权利要求2所述的方法,其中,所述根据所述文本的类型,选择与所述文本的类型对应的识别模型,包括:
在所述文本的类型是第一类型的情况下,选择第一识别模型,其中,所述第一识别模型包括:分词器、转换器、特征提取器和分类器,其中,所述分词器用于对所述文本中的句子进行分词,所述转换器用于将分词结果转换为向量序列,所述特征提取器用于基于所述向量序列提取语义特征,所述分类器用于基于提取的语义特征判断所述文本中是否包含不良事件。


4.如权利要求3所述的方法,其中,所述分词器包括第一分词器和第二分词器,其中,所述第一分词器用于逐字地对所述文本进行分词,所述第二分词器用于逐词对所述文本进行分词;
其中,转换器包括第一转换器和第二转换器,其中,所述第一转换器用于将第一分词器的分词结果转换为字向量序列,所述第二转换器用于将第二分词器的分词结果转换为词向量序列。


5.如权利要求4所述的方法,其中,所述第二分词器用于逐词对所述文本进行分词,包括:
根据通用词典与领域专业词典生成的字典树,生成所述文本中的句子中所有分词情况的有向无环图,从而实现逐词对所述文本进行分词。


6.如权利要求4所述的方法,其中,所述利用选择的识别模型,对所述文本执行语义识别以识别所述文本中的不良事件,包括:
利用所述第一分词器逐字地对所述文本中的句子进行分词并利用所述第二分词器逐词地对所述文本中的句子进行分词;
利用所述第一转换器将所述第一分词器的分词结果转换为字向量序列并利用所述第二转换器将所述第二分词器的分词结果转换为词向量序列;
利用所述特征提取器基于所述字向量序列和所述词向量序列提取语义特征;
利用所述分类器基于提取的语义特征判断所述文本中是否包含不良事件,
其中,在所述文本中不良事件发生的概率大于预定阈值的情况下,确定所述文本中包含不良事件。


7.如权利要求2所述的方法,其中,所述根据所述文本的类型,选择与所述文本的类型对应的识别模型,包括:
在所述文本的类型是第二类型的情况下,选择第二识别模型,其中,所述第二识别模型包括:命名实体识别器、不良事件名称识别器、语义角色标识器、语义角色筛选器和事件确定器,其中,所述命名实体识别器用于识别文本中的命名实体,所述不良事件名称识别器用于识别文本中的不良事件名称,所述语义角色标识器用于根据识别出的命名实体和不良事件名称标识出文本的句子中不良事件发生的语义角色,所述语义角色筛选器用于根据标识出的语义角色和预定规则筛选出至少一部分角色,所述事件确定器用于根据筛选出的角色和预定触发词确定文本中是否包含不良事件。


8.如权利要求7所述的方法,其中,所述利用选择的识别模型,对所述文本执行语义识别以识别所述文本中的不良事件,包括:
利用所述命名实体识别器识别文本中的命名实体;
利用所述不良事件名称识别器识别文本中的不良事件名称;
利用所述语义角色标识器根据识别出的命名实体和不良事件名称标识出文本的句子中不良事件发生的语义角色;
利用所述语义角色筛选器根据标识出的语义角色和预定规则筛选出至少一部分角色;以及
利用所述事件确定器根据筛选出的角色和预定触发词确定文本中是否包含不良事件,
其中,在筛选的角色和所述预定触发词满足预设事件三元组的情况下,确定所述文本中包含不良事件。


9.如权利要求8所述的方法,其中,第二识别模型还包括:共指消解器,用于完成所述文本中的共指消解,从而确定药物和不良事件之间的关联关系,
其中,所述利用选择的识别模型,在所述文本中识别不良事件,还包括:
在利用语义角色标识器根据识别出的命名实体和不良事件名称标识出文本的句子中不良事件发生的语义角色之后,利用所述共指消解器完成所述文本中的共指消解。


10.如权利要求1至9中的任一项所述的方法,其中,所述不良事件至少包含以下三要素:对象、诱因和不良结果。


11.如权利要求10所述的方法,还包括:通过预定汇报人反馈关于不良事件的识别结果。


12.如权利要求1所述方法,其中,所述识别模型是医药领域的识别模...

【专利技术属性】
技术研发人员:赵奇金毅黄晞益刘戈朱晨
申请(专利权)人:阿斯利康投资中国有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1