【技术实现步骤摘要】
实体知识图谱建立、属性信息获取、门诊分诊方法及装置
本申请涉及信息处理
,具体涉及一种目标领域实体知识图谱建立方法、属性信息获取方法、门诊分诊方法及装置、设备。
技术介绍
在一些
(例如,医疗领域或刑侦领域等),可以从该
中的已有文档(例如,医疗领域中的历史病历、医学文献等或刑侦领域中的历史询问笔录、刑侦文献等)学习到可用信息,以便后续可以利用这些可用信息来分析该
中的新文档(例如,医疗领域中的新病历或刑侦领域中的新询问笔录)。另外,上述可用信息通常是利用基于该
的专家规则构建的专家系统进行学习的。其中,因针对不同已有文档制定的专家规则是不同的,甚至是相反的,如此导致利用专家系统学习到的可用信息的准确性会产生跷跷板现象。
技术实现思路
有鉴于此,本申请实施例提供一种实体知识图谱建立、属性信息获取、门诊分诊方法及装置,能够准确地从已有文档中学习可用信息。为解决上述问题,本申请实施例提供的技术方案如下:第一方面,提供一种目标领域实体知识图谱建立方法,所述方法包括:利用实体识别模型对第二文本进行实体识别,和/或,利用目标领域分词器对第二文本进行实体识别;所述实体识别模型是利用第一文本以及第一分词结果训练得到的,所述第一分词结果是利用目标领域分词器对所述第一文本进行分词得到的;所述目标领域分词器包括目标领域术语词典,所述目标领域术语词典包括目标领域术语以及所述目标领域术语对应的实体类别标签;将识别得到的实体以及对应的实体类别标签添加到目 ...
【技术保护点】
1.一种目标领域实体知识图谱建立方法,其特征在于,所述方法包括:/n利用实体识别模型对第二文本进行实体识别,和/或,利用目标领域分词器对第二文本进行实体识别;所述实体识别模型是利用第一文本以及第一分词结果训练得到的,所述第一分词结果是利用目标领域分词器对所述第一文本进行分词得到的;所述目标领域分词器包括目标领域术语词典,所述目标领域术语词典包括目标领域术语以及所述目标领域术语对应的实体类别标签;/n将识别得到的实体以及对应的实体类别标签添加到目标领域实体列表;/n获取所述目标领域实体列表中各个实体之间的关联关系以及各个实体的相关属性;/n利用所述目标领域实体列表中实体对应的实体类别标签、各个实体之间的关联关系以及各个实体的相关属性建立目标领域实体知识图谱。/n
【技术特征摘要】
1.一种目标领域实体知识图谱建立方法,其特征在于,所述方法包括:
利用实体识别模型对第二文本进行实体识别,和/或,利用目标领域分词器对第二文本进行实体识别;所述实体识别模型是利用第一文本以及第一分词结果训练得到的,所述第一分词结果是利用目标领域分词器对所述第一文本进行分词得到的;所述目标领域分词器包括目标领域术语词典,所述目标领域术语词典包括目标领域术语以及所述目标领域术语对应的实体类别标签;
将识别得到的实体以及对应的实体类别标签添加到目标领域实体列表;
获取所述目标领域实体列表中各个实体之间的关联关系以及各个实体的相关属性;
利用所述目标领域实体列表中实体对应的实体类别标签、各个实体之间的关联关系以及各个实体的相关属性建立目标领域实体知识图谱。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
利用目标领域分词器对第一文本进行分词得到第一分词结果,所述第一分词结果包括第一分词、所述第一分词对应的实体类别标签以及所述第一分词中每个字符的字符序列标签;
利用所述第一文本以及所述第一分词结果训练得到实体识别模型。
3.根据权利要求1或2所述的方法,其特征在于,所述目标领域术语词典为医疗领域术语词典,所述目标领域术语为医疗领域术语,所述目标领域分词器为医疗领域分词器,所述目标领域实体列表为医疗领域实体列表,所述目标领域实体知识图谱为医疗领域实体知识图谱。
4.一种属性信息获取方法,其特征在于,所述方法包括:
获取目标文本;
利用实体识别模型对所述目标文本进行实体识别得到目标实体,和/或,利用目标领域实体列表对所述目标文本进行实体识别得到目标实体;所述目标领域实体列表是在权利要求1-2任一项所述的目标领域实体知识图谱建立方法实现过程中获得的;所述实体识别模型是利用第一文本以及第一分词结果训练得到的,所述第一分词结果是利用目标领域分词器对所述第一文本进行分词得到的;所述目标领域分词器包括目标领域术语词典,所述目标领域术语词典包括目标领域术语以及所述目标领域术语对应的实体类别标签;
在目标领域实体知识图谱中查找与所述目标实体具有关联关系的实体,和/或所述目标实体对应的相关属性,所述目标领域实体知识图谱是根据权利要求1-2任一项所述的目标领域实体知识图谱建立方法建立的。
5.一种实现门诊分诊的方法,其特征在于,所述方法包括:
获取病历文本;
利用实体识别模型对所述病历文本进行实体识别得到目标实体,和/或,利用医疗领域实体列表对所述病历文本进行实体识别得到目标实体;所述医疗领域实体列表是在权利要求3所述的目标领域实体知识图谱建立方法实现过程中获得的;所述实体识别模型是利用第一文本以及第一分词结果训练得到的,所述第一分词结果是利用医疗领域分词器对所述第一文本进行分词得到的;所述医疗领域分词器包括医疗领域术语词典,所述医疗领域术语词典包括医疗领域术语以及所述医疗领域术语对应的实体类别标签;
在医疗领域实体知识图谱中查找与所述目标实体具有关联关系的实体,和/或所述目标实体对应的相关属性,所述医疗领域实体知识图谱是根据权利要求3所述的目标领域实体知识图谱建立方法建立的;
当与所述目标实体具有关联关系的实体和/或所述目标实体对应的相关属性中包括科室实体和/或检查项目信息时,对所述科室实体和/或所述检查项目信息进行输出提示。
6.一种目标领域实体知识图谱建立装置,其特征在于,所述装置包括:
文本实体识别单元,用于利用实体识别模型对第...
【专利技术属性】
技术研发人员:李晓东,马鑫,付博,金文艳,
申请(专利权)人:沈阳东软熙康医疗系统有限公司,
类型:发明
国别省市:辽宁;21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。