一种从电子病历抽取静脉血栓栓塞症相关信息用于构建知识图谱的方法技术

技术编号：40804952 阅读：20 留言：0更新日期：2024-03-28 19:29

本发明专利技术涉及一种从电子病历抽取静脉血栓栓塞症相关信息用于构建知识图谱的方法，属于自然语言处理领域。本发明专利技术根据哈尔滨工业大学网络智能研究室给出的标签规范结合静脉血栓栓塞症相关风险评估量表定义实体类型和关系类型，用于标注临床的电子病历中静脉血栓栓塞症相关信息；其次在联合抽取模型上融入双仿射机制，让电子病历文本中的实体对进行信息交互，提升医疗文本实体识别和关系抽取的效果；通过以上过程本发明专利技术达到了在临床电子病历中抽取静脉血栓栓塞症相关信息从而构建知识图谱的目的。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种从电子病历抽取静脉血栓栓塞症相关信息用于构建知识图谱的方法，属于自然语言处理领域。

技术介绍

1、静脉血栓栓塞症(venous thromboembolism，vte)包括深静脉血栓形成(deepvenous thrombosis，dvt)和肺栓塞(pulmonary embolism，pe)在内的一系列疾病，其病死率仅次于在肿瘤和心肌梗死。然而，只有一小部分患者接受了推荐的静脉血栓栓塞预防治疗，在偏远地区这一情况更加严重。因此，我们迫切需要提高非专科医生对vte的及时诊疗和增强患者对vte危险性的认识。

2、电子病历(emr)记录了患者在医院中的整个医疗活动，包含了大量的专业医学知识，是一种珍贵的医疗信息资源。知识图谱能够有效地整合电子病历中的医学知识，为提高非专科医生对vte的及时诊疗和增强患者对vte危险性提供了可选择的解决方案。信息抽取(ie)能够从非结构化的电子病历中识别与患者密切相关的特定命名实体和关系，获得有价值的医学知识。但是，传统电子病历信息抽取方法依赖于具体的领域、语言和文本风格等因素，...

【技术保护点】

1.一种从电子病历抽取静脉血栓栓塞症相关信息用于构建知识图谱的方法，其特征在于，所述方法包括如下：

2.根据权利要求1所述的一种从电子病历抽取静脉血栓栓塞症相关信息用于构建知识图谱的方法，其特征在于：所述Step1中，定义实体类型和关系类型；定义实体类型，用于标注实体类型；定义关系类型，用于标注关系类型；数据清洗是对异类异常值，格式异常及脏乱进行映射和清洗。

3.根据权利要求1所述的一种从电子病历抽取静脉血栓栓塞症相关信息用于构建知识图谱的方法，其特征在于：所述Step2中包括：对标注好的数据进行预处理，包括把对超出最大长度的文本进行切分，获取每一句中的实体位置和...

【技术特征摘要】

1.一种从电子病历抽取静脉血栓栓塞症相关信息用于构建知识图谱的方法，其特征在于，所述方法包括如下：

2.根据权利要求1所述的一种从电子病历抽取静脉血栓栓塞症相关信息用于构建知识图谱的方法，其特征在于：所述step1中，定义实体类型和关系类型；定义实体类型，用于标注实体类型；定义关系类型，用于标注关系类型；数据清洗是对异类异常值，格式异常及脏乱进行映射和清洗。

3.根据权利...

【专利技术属性】
技术研发人员：贺建峰，蔡风华，张洪江，鲁成新，刘云川，
申请(专利权)人：昆明理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人