【技术实现步骤摘要】
生物医学事件组装方法、装置、设备及介质
[0001]本专利技术涉及自然语言处理
,特别涉及生物医学事件组装方法、装置、设备及介质。
技术介绍
[0002]生物医学事件抽取是指从生物医学文献中自动提取出事件,并以结构化信息表示。生物医学事件信息对研制新药、精准医学和基础生物医学研究具有重要意义。
[0003]事件有其固定的事件类型、触发词和论元,其中事件触发词用来标识事件的发生,论元则表示事件的参与者。例如句子“Interestingly,we observed a specific four
‑
fold upregulation of Id1 mRNA in BMP
‑6‑
treated B cell.”中包含一个正向调控类事件,触发词是“upregulation”,含有两个论元,一个是“Id1”,角色为题元(Theme),表明发生事件的主体,另一个是“BMP
‑
6”,角色为原因(Cause),表明引起事件发生的蛋白质实体。在生物医学领域的事件类型中,基因表 ...
【技术保护点】
【技术特征摘要】
1.一种生物医学事件组装方法,其特征在于,包括:基于待组装文本的触发词类型,将所述待组装文本的触发词和所述待组装文本的论元进行组合,以得到所述待组装文本的候选事件;利用嵌套标记法对所述候选事件的触发词和所述候选事件的论元进行标记,以得到候选实例;利用预设深度学习模型对所述候选实例进行编码,以得到所述候选实例的语义信息的输出表征;获取所述输出表征的预设合法类别的第一概率结果以及预设非法类别的第二概率结果,然后基于所述第一概率结果和所述第二概率结果从所述候选事件中确定出目标生物医学事件。2.根据权利要求1所述的生物医学事件组装方法,其特征在于,所述基于待组装文本的触发词类型,将所述待组装文本的触发词和所述待组装文本的论元进行组合,以得到所述待组装文本的候选事件,包括:若待组装文本的触发词类型为预设多元类事件,则从所述待组装文本的所有论元中筛选出题元角色的实体论元;将所述待组装文本的触发词和所述题元角色的实体论元进行组合,以得到所述待组装文本的候选事件。3.根据权利要求1所述的生物医学事件组装方法,其特征在于,所述基于待组装文本的触发词类型,将所述待组装文本的触发词和所述待组装文本的论元进行组合,以得到所述待组装文本的候选事件,包括:若待组装文本的触发词类型为预设嵌套类事件,则从所述待组装文本的所有论元中筛选出题元角色的论元和原因角色的论元;将所述待组装文本的触发词、所述题元角色的论元、所述原因角色的论元进行组合,以得到包含第一预设数量个所述题元角色的论元和第二预设数量个所述原因角色的论元的所述待组装文本的候选事件。4.根据权利要求1所述的生物医学事件组装方法,其特征在于,所述利用嵌套标记法对所述候选事件的触发词和所述候选事件的论元进行标记,以得到候选实例,包括:利用嵌套标记法对所述候选事件的触发词进行标记,并判断所述候选事件的当前论元是否满足预设条件;若满足则利用所述嵌套标记法对所述候选事件的当前论元进行第一标记,以得到第一候选实例。5.根据权利要求4所述的生物医学事件组装方法,其特征在于,所述判断所述候选事件的当前论元是否满足预设条件之后,还包括:若不满足则利用所述嵌套标记法...
【专利技术属性】
技术研发人员:钱龙华,吴鹏超,董越虎,李雪峰,李东玲,李军辉,周国栋,
申请(专利权)人:苏州大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。