用于辅助疾病智能诊断的医学概念链接系统及存储介质技术方案

技术编号:32973941 阅读:59 留言:0更新日期:2022-04-09 11:46
本发明专利技术涉及一种医学概念链接系,其包括:存储单元,其存储与医学概念有关的知识图谱;获取单元,其获取用户的主诉;以及处理单元,其包括:主诉识别模块,其利用自然语言处理模型识别所获取的所述主诉中的mention的实体及其实体类型;关系识别模块,其基于自然语言处理模型抽取从所述主诉中识别出的所述mention的所述实体之间的关系;组合关系元组获取模块,其基于所识别的mention中的实体及其实体类型以及所抽取的关系,根据知识图谱中的医学概念间的关系而对实体及其关系进行组合从而获得组合关系元组;以及医学概念链接模块,其将组合关系元组实体链接至知识图谱中的对应医学概念中。本发明专利技术还涉及存储能够实现医学概念链接系统的功能的指令的存储介质。接系统的功能的指令的存储介质。接系统的功能的指令的存储介质。

【技术实现步骤摘要】
用于辅助疾病智能诊断的医学概念链接系统及存储介质


[0001]本专利技术涉及一种用于辅助疾病智能诊断的医学概念链接系统及存储介质。

技术介绍

[0002]本申请涉及人工智能、自然语言处理、知识图谱、机器学习领域,例如可以应用于智能问诊、智能问答、信息检索领域。
[0003]医学概念链接实际上是一种涉及医学的实体链接(Entity Linking)。如本领域的技术人员所知悉的,实体链接是指,基于给定实体(Entity,实体是知识图谱的基本单元以及这些基本单元组合的复合实体,也是文本中承载信息的重要语言单位)及其关系的知识图谱(Knowledge Graph),将已经利用标注好的mention(提及,即自然文本中表达实体的语言片段)的语料中的每个mention匹配到知识图谱中其对应的实体上。如果知识图谱中没有某一mention对应的实体,则认为该mention不可链接到当前知识图谱,标记为NIL。实体链接系统主要包含三个模块,分别为Candidate Entity Generation,Candidate Entity Ranking,Unlinkable Mention Prediction。
[0004]然而,当前常规的实体链接所解决的问题通常是单个实体的链接,但是,在医学概念识别中,医学概念是两个实体或多个实体的复合。因此,常规的实体链接在实践医学概率链接时准确度不高且存在错误链接的可能。
[0005]此外,现有实体链接可以基于子图嵌入或知识图谱中知识进行排序,而医学概念知识图通常谱缺乏知识描述且医学概念是标准医学术语,因此,在患者主诉不能按照标准医学概念进行准确描述地情况下,医学概念可能无法被准确识别出来并且会出现对患者主诉的错误医学概念链接。
[0006]针对以上问题,需要一种改进的医学概念链接系统,其能够准确的识别患者主诉中的医学概念并且实现对医学概念的进一步准确确定。

技术实现思路

[0007]针对现有技术的上述缺陷,本申请提出了一种医学概念链接系统,其包括:存储单元,其被配置为存储与医学概念有关的知识图谱;获取单元,其被配置成获取用户的主诉;以及处理单元,其包括:
[0008]‑
主诉识别模块,其被配置为利用自然语言处理模型识别所获取的所述主诉中的mention的实体及其实体类型;
[0009]‑
关系识别模块,其被配置为基于自然语言处理模型抽取从所述主诉中识别出的所述mention的所述实体之间的关系;
[0010]‑
组合关系元组获取模块,其被配置为基于所识别的所述mention中的所述实体及其实体类型以及所抽取的所述关系,根据所述知识图谱中的所述医学概念间的关系而对所述实体及其关系进行组合从而获得组合关系元组;以及
[0011]‑
医学概念链接模块,其被配置为将所述组合关系元组实体链接至所述知识图谱
中的对应医学概念中。
[0012]进一步地,医学概念链接系统还包括人机交互界面以及输出交互界面,其中,所述人机交互界面用于接收由用户输入的所述主诉,其包括所述用户的人群信息以及所述症状,其中,所述人机交互界面被构造成以所述用户可实现的任何形式接收所述主诉;并且其中,所述输出交互界面用于向所述用户显示医学链接结果。
[0013]进一步地,所述处理单元还包括实体同义词匹配模块,其被配置为将所获得的所述组合关系元组中所涉及的所述mention的每个实体与人工整理的同义词库进行匹配以进行实体同义词扩展。
[0014]进一步地,所述处理单元还包括实体同义词挖掘模块,其被配置为基于人工整理的所述同义词库以及自然语言处理匹配模型进行同义词挖掘以补充人工整理的所述同义词库。
[0015]进一步地,所述实体同义词挖掘模块将爬虫获取的互联网问诊数据进行NER实体标注,基于人工整理的所述同义词库中的实体进行BERT语义匹配模型计算,以对人工整理的所述同义词库中的所述实体进行挖掘以获得新同义词。
[0016]进一步地,所述实体同义词挖掘模块还被配置为对于BERT语义匹配模型所获得的新同义词进行人工参与修订并更新人工整理的所述同义词库,以获得初步挖掘同义词库。
[0017]进一步地,所述实体同义词挖掘模块还被配置为基于所述初步挖掘同义词库并再次基于爬虫获取的所述互联网问诊数据进行迭代挖掘以获取进一步的新同义词,以再次迭代更新所述初步挖掘同义词库以获得最终挖掘同义词库。
[0018]进一步地,所述医学链接系统包括语义匹配计算模块,其被配置为利用BERT语义匹配模型基于爬虫获取的互联网问诊数据对所述用户的所述mention中的所述实体中与所述最终初步挖掘同义词库中的实体无法匹配的实体进行额外语义匹配,从而获得与该实体语义匹配相似度高于确定阈值的实体同义词。
[0019]进一步地,所述组合关系元组获取模块被构造为将所述用户的所述主诉中的所述mention的所述实体中与所述最终同义词库中相匹配的同义词或者经额外语义匹配计算所获得同义词相关的所有实体分别应用至所述组合关系元组中以获得一组组合关系元组。
[0020]本申请还涉及一种存储介质,其存储指令,当所述指令被执行时,所述指令实现至少如上所述的功能。
[0021]利用本申请所公开的医学概念链接系统,其能够准确的识别患者主诉中的医学概念并且实现对医学概念的进一步准确确定,从而使得更准确且更广泛地识别用户主诉中可能出现的信息而不会遗漏。
附图说明
[0022]本专利技术的其他显著特征和优点从以下参考以下附图出于说明目的而提供的非限制性描述中得出,其中:
[0023]图1示出了根据本专利技术的实施例的医学概念链接系统的结构框图;
[0024]图2示出了根据本专利技术的实施例的医学概念链接系统所执行的流程的流程图;
[0025]图3示出了根据本专利技术的另一实施例的医学概念链接系统所执行的流程的流程图;
[0026]图4示出了根据本专利技术的实施例的医学概念链接系统所执行的流程的流程图的一部分;以及
[0027]图5示出了根据本专利技术的实施例的医学概念链接系统的总体结构图。
具体实施方式
[0028]图1示出了根据本专利技术的实施例的用于辅助疾病智能诊断的医学概念链接系统1的结构框图。
[0029]如图1所示,本申请的医学概念链接系统1包括存储单元12、获取单元14以及处理单元16,其中,处理单元16包括主诉识别模块162、关系识别模块164、组合关系元组获取模块166、以及医学概念链接模块168。
[0030]在本申请的实施例中,存储单元12存储与医学概念有关的知识图谱。
[0031]在本申请的实施例中,获取单元14被构造为获取用户的主诉信息。作为示例,本申请范围内的医学概念链接系统1的主诉获取模14块为人机交互界面,其中,该人机交互界面被构造为接收由用户输入的初始主诉。该人机交互界面构造成以用户可实现的任何形式(例如,语音输入、文字输入、图像识别)接收用户主诉本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种医学概念链接系统,所述医学概念链接系统包括:存储单元,其被配置为存储与医学概念有关的知识图谱;获取单元,其被配置成获取用户的主诉;以及处理单元,其包括:主诉识别模块,其被配置为利用自然语言处理模型识别所获取的所述主诉中的mention的实体及其实体类型;关系识别模块,其被配置为基于自然语言处理模型抽取从所述主诉中识别出的所述mention的所述实体之间的关系;组合关系元组获取模块,其被配置为基于所识别的所述mention中的所述实体及其实体类型以及所抽取的所述关系,根据所述知识图谱中的所述医学概念间的关系而对所述实体及其关系进行组合从而获得组合关系元组;以及医学概念链接模块,其被配置为将所述组合关系元组实体链接至所述知识图谱中的对应医学概念中。2.根据权利要求1所述的医学概念链接系统,还包括人机交互界面以及输出交互界面,其中,所述人机交互界面用于接收由用户输入的所述主诉,其包括所述用户的人群信息以及所述症状,其中,所述人机交互界面被构造成以所述用户可实现的任何形式接收所述主诉;并且其中,所述输出交互界面用于向所述用户显示医学链接结果。3.根据权利要求1或2所述的医学链接系统,其中,所述处理单元还包括:实体同义词匹配模块,其被配置为将所获得的所述组合关系元组中所涉及的所述mention的每个实体与人工整理的同义词库进行匹配以进行实体同义词扩展。4.根据权利要求3所述的医学链接系统,其中,所述处理单元还包括:实体同义词挖掘模块,其被配置为基于人工整理的所述同义词库以及自然语言处理匹配模型进行同义词挖掘以补充人工整理的所述同义词库。5.根据权利要求4所述的...

【专利技术属性】
技术研发人员:韩雪冬董皓李景阳
申请(专利权)人:北京欧应信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1