一种医疗知识图谱搭建方法及装置制造方法及图纸

技术编号:30639713 阅读:67 留言:0更新日期:2021-11-04 00:32
本申请公开了一种医疗知识图谱搭建方法及装置,通过通过获取初始数据,对所述初始数据进行识别获取第一文本数据;对所述第一文本数据进行处理获取第一实体对集合;对所述第一实体对集合进行过滤处理获取第二实体对集合;对所述第二实体对集合进行处理获取目标实体对集合;确定旧知识图谱中是否包含所述目标实体对集合;如果包含,则将所述目标实体对集合进行验证后加入旧知识图谱。本申请提升了实体关系抽取的效率,减少了需要判断的实体对。使用深度网络模型获取各个关系类别的概率,通过实体对的先验信息获取对应的关系类别,设置相关的阈值,可提高抽取到专家知识三元组数据的准确率。准确率。准确率。

【技术实现步骤摘要】
一种医疗知识图谱搭建方法及装置


[0001]本申请涉及计算机
,尤其涉及一种医疗知识图谱搭建方法及装置。

技术介绍

[0002]医疗平台上都会有大量的医学教学、诊疗会议等音视频数据,而这些数据中蕴含着大量的各个科室专家对各科疾病的诊断思路、治疗方案、疗效预测等,也就是医疗领域的专家知识,是由疾病的症状、疾病的名称、治疗方案、推荐治疗药物等数据知识融合而来。这些数据需要从大量的长文本数据中,有效地提取,并将这些专家知识数据进行相应的融合及保存。目前就长文本数据抽取结构化数据都是基于pipeline式的关系抽取方法,其计算冗余、准确率低。

技术实现思路

[0003]本申请提供了一种医疗知识图谱搭建方法及装置,以解决现有就长文本数据抽取结构化数据都是基于pipeline式的关系抽取方法,其计算冗余、准确率低的问题。
[0004]第一方面,为实现上述目的,本申请提供了一种医疗知识图谱搭建方法,所述方法包括:
[0005]获取初始数据,对所述初始数据进行识别获取第一文本数据;
[0006]对所述第一文本数据进本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种医疗知识图谱搭建方法,其特征在于,所述方法包括:获取初始数据,对所述初始数据进行识别获取第一文本数据;对所述第一文本数据进行处理获取第一实体对集合;对所述第一实体对集合进行过滤处理获取第二实体对集合;对所述第二实体对集合进行处理获取目标实体对集合。2.根据权利要求1所述的医疗知识图谱搭建方法,其特征在于,所述对所述第一文本数据进行处理获取第一实体对集合,包括:对所述第一文本数据进行处理获取预处理获取第二文本数据;对所述第二文本数据进行实体识别,获取实体集合;根据预设关系,对所述实体集合进行处理获取第一实体对集合。3.根据权利要求2所述的医疗知识图谱搭建方法,其特征在于,所述对所述第二实体对集合进行处理获取目标实体对集合,包括:对所述第二实体对集合进行关系分类获取第三实体对集合;确定所述第三实体对集合中的关系是否成立,如果成立获取第四实体对集合;对所述第四实体对集合进行融合获取目标实体对集合。4.根据权利要求1所述的医疗知识图谱搭建方法,其特征在于,所述对所述第二实体对集合进行处理获取目标知识图谱之后,还包括:确定旧知识图谱中是否包含所述目标实体对集合;如果包含,则将所述目标实体对集合进行验证后加入旧知识图谱。5.根据权利要求4所述医疗知识图谱搭建方法,其特征在于,所述确定旧知识图谱中是否包含所述目标实体对集合之后,还包括:如果不包含,则在旧知识图谱中创建实体。6.一种医疗...

【专利技术属性】
技术研发人员:袁孟全岑汉刘海兵杨健潘英剑刘敬世
申请(专利权)人:贵阳叁玖互联网医疗有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1