一种管道式高鲁棒性医学知识图谱标准化构建方法技术

技术编号：38044958 阅读：9 留言：0更新日期：2023-06-30 11:11

本申请提供一种管道式的高鲁棒性标准化医疗知识图谱构建方法及装置,该方法包括：枚举医学文本中所有候选实体词跨度进行悬浮标记，将所有候选实体词跨度的悬浮标记附加到医学文本后作为一个训练实例，对实体词跨度的悬浮标记进行分组，利用预训练语言模型获取每一组中实体词跨度的语境化表示，根据语境化表示，利用神经网络结构输出实体类型信息；根据语境化表示和实体类型信息编码，得到实体类别信息之间的关系类别，并输出关系信息；利用实体类型信息和关系信息与医学术语标准进行对齐，构建医学知识图谱。构建医学知识图谱。构建医学知识图谱。

全部详细技术资料下载

【技术实现步骤摘要】
一种管道式高鲁棒性医学知识图谱标准化构建方法

[0001]本申请涉及医学信息知识图谱
，尤其涉及一种管道式高鲁棒性医学知识图谱标准化构建方法。

技术介绍

[0002]临床文本实体抽取是针对医学文本的重要自然语言处理技术，用于提取其中大量的专业知识和丰富的有用信息。相关技术中的临床文本实体抽取方法主要包括基于规则的、基于传统机器学习和深度学习的方法。
[0003]而相关技术中基于规则的医疗实体抽取方法在领域词典足够完善的情况下，当制定的规则能够对目标领域文本的特征精准描述时，基于规则的方法将会有比其他方法更好的表现。但是，制定领域规则模板和维护领域词典耗时耗力，并且对专业知识的要求很高。不同的领域具有不同的规则与词典，导致该方法的可迁移性较差。
[0004]基于传统机器学习的方法需要大量人工标记的数据集对模型参数进行训练,而现有可用的大规模医疗数据集比较稀缺。并且，基于机器学习的方法需要专家手动选择对命名实体识别任务有影响的各种特征，这意味着昂贵的标注成本。
[0005]基于深度学习的医疗命名实体识别模型一般包括输入层、嵌入层、编码层、解码层和输出层。嵌入层的语言模型可从输入的医疗文本中学习到语义、语法知识并将其向量化表示，主要有基于词的表示、基于字的表示以及基于字信息和词信息的混合表示；编码层使用CNN、RNN、Transformer等网络结构对嵌入层传入的信息进行特征提取并编码；解码层利用解码器对编码层的输出结果进行标签预测，最终输出最佳标签序列。
[0006]而相关技术中，即...

【技术保护点】

【技术特征摘要】
1.一种管道式高鲁棒性医学知识图谱标准化构建方法，其特征在于，该方法包括：枚举医学文本中所有候选实体词跨度进行悬浮标记，将所有所述候选实体词跨度的悬浮标记附加到所述医学文本后作为一个训练实例，对所述实体词跨度的悬浮标记进行分组，利用预训练语言模型获取每一组中所述实体词跨度的语境化表示，根据所述语境化表示，利用神经网络结构输出实体类型信息；根据所述语境化表示和所述实体类型信息编码，得到所述实体类别信息之间的关系类别，并输出关系信息；利用所述实体类型信息和所述关系信息与医学术语标准进行对齐，构建医学信息知识图谱。2.根据权利要求1所述的方法，其特征在于，所述候选实体词包括：开始词和结束词；所述枚举医学文本中所有候选实体词跨度进行悬浮标记，包括：以所述医学文本中的每个字分别作为所述开始词，以所述开始词及所述开始词之后的字分别作为所述结束词；应用注意力掩码矩阵，以所述开始词至所述结束词为跨度对所有所述候选实体词依次进行悬浮标记；其中，每个所述悬浮标记在注意力掩码矩阵中对同跨度内的另一个悬浮标记可见，对其他跨度的悬浮标记不可见。3.根据权利要求2所述的方法，其特征在于，对所述实体词跨度的悬浮标记进行分组，包括：对所述依次进行的悬浮标记进行排序；将所述悬浮标记划分为大小为K的组，将位置相邻的所述跨度优先划分到同一个组中，其中K为一个组里最大跨度数；分别对每个组的所述悬浮标记进行并行处理。4.根据权利要求1所述的方法，其特征在于，根据所述语境化表示和所述实体类型信息编码，得到所述实体类别信息之间的关系类别，并输出关系信息，包括：获取利用预训练语言模型得到的每一组中所述实体词跨度的语境化表示向量；获取所述实体类别信息编码成固定维度的向量；拼接所述语境化表示向量和所述实体类别信息编码成固定维度的向量预测出所述实体类别信息中的主实体与客实体之间所属每个关系的类别。5.根据权力要求4所述的方法，其特征在于，所述拼接所述语境化的表示编码向量和所述实体类别信息编码成固定维度的向量预测出所述实体类别信息中的主实体与客实体之间所属每个关系的类别，包括：将拼接的所述语境化表示编码向量和所述实体类别信息编码成固定维度的向量并行通过基于前馈神经网络的FFN
‑
head和FFN

【专利技术属性】
技术研发人员：王光宇，张将将，范龙君，张平，刘晓鸿，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人