基于知识图谱的PET/CT影像报告结论辅助生成方法及装置制造方法及图纸

技术编号:37156049 阅读:16 留言:0更新日期:2023-04-06 22:17
本发明专利技术提供一种基于知识图谱的PET/CT影像报告结论辅助生成方法及装置,包括:获取PET/CT影像数据,PET/CT影像数据包括第一影像表现文本信息;将第一影像表现文本信息输入至训练好的文本分类模型中,得到结构化文本分类结果;将分类结果输入至训练好的文本生成模型中,得到影像表现文本摘要,并将文本摘要输入至训练好的二分类模型中,得到影像异常表现摘要;基于历史影像报告构建知识图谱;将第一影像表现文本信息输入至训练好的实体抽取模型中,得到第一实体,基于第一实体和知识图谱确定诊断建议文本和疾病类型文本;将影像异常表现摘要、诊断建议文本和疾病类型文本作为待预测的PET/CT影像数据的第一影像结论文本。该方法提高了影像结论生成的效率和准确率。法提高了影像结论生成的效率和准确率。法提高了影像结论生成的效率和准确率。

【技术实现步骤摘要】
基于知识图谱的PET/CT影像报告结论辅助生成方法及装置


[0001]本专利技术涉及计算机
,尤其涉及一种基于知识图谱的PET/CT影像报告结论辅助生成方法及装置。

技术介绍

[0002]PET/CT是一种将PET(功能代谢显像)和CT(解剖结构显像)两种影像技术有机地结合的新型影像设备,是将微量的正电子核素示踪剂注射到人体内,然后采用特殊的体外探测仪(PET)探测这些正电子核素人体各脏器的分布情况,通过计算机断层显像的方法显示人体的主要器官的生理代谢功能,同时应用CT技术为这些核素分布情况进行精确定位。PET/CT影像广泛应用于肿瘤、冠心病和脑部等疾病的辅助诊断和评价等。
[0003]目前主流的PET/CT设备厂商的放射信息系统所产生的PET/CT影像报告由影像表现和影像结论两部分组成。其中的影像表现部分一般由医师手动生成或通过一些图像到文本的文本自动生成方法而生成;而影像结论部分一般由影像表现的摘要、疑似疾病和诊断建议三部分组成。由于影像结论部分的内容是通过分析PET/CT影像的影像表现而得出的结论,目前其完全是医师分析判断后将得到的结论手动输入以生成,该影像结论生成时完全取决于医师的经验和水平,因而难以确保影像结论的精确度;并且当医师分析出PET/CT影像的影像结论后,则还需手动输入具体的文本内容,则降低了PET/CT影像结论生成的效率。因此,如何提高影像结论生成的精确度以及效率是亟待解决的技术问题。

技术实现思路

[0004]有鉴于此,本专利技术提供了一种基于知识图谱的PET/CT影像报告结论辅助生成方法及装置,以解决现有技术中存在的一个或多个问题。
[0005]根据本专利技术的一个方面,本专利技术公开了一种基于知识图谱的PET/CT影像报告结论辅助生成方法,所述方法包括:
[0006]获取待预测的PET/CT影像数据,所述PET/CT影像数据包括第一影像表现文本信息;
[0007]将所述第一影像表现文本信息输入至训练好的文本分类模型中,得到以不同身体部位为类别的结构化文本分类结果;
[0008]将所述结构化文本分类结果输入至训练好的文本生成模型中,得到各类别的身体部位对应的影像表现文本摘要,并将所述影像表现文本摘要输入至训练好的二分类模型中,得到影像异常表现摘要;
[0009]基于历史影像报告构建知识图谱;
[0010]将所述第一影像表现文本信息输入至训练好的实体抽取模型中,得到所述第一影像表现文本信息的第一实体,基于所述第一实体和知识图谱确定所述第一影像表现文本信息对应的诊断建议文本和疾病类型文本;
[0011]将所述影像异常表现摘要、诊断建议文本和疾病类型文本作为所述待预测的PET/
CT影像数据的第一影像结论文本。
[0012]在本专利技术的一些实施例中,所述方法还包括:
[0013]基于所述历史影像报告构建第一样本数据集、第二样本数据集、第三样本数据集以及第四样本数据集;
[0014]基于所述第一样本数据集、第二样本数据集、第三样本数据集以及第四样本数据集分别对第一网络模型、第二网络模型、第三网络模型和第四网络模型进行预训练,得到训练好的文本分类模型、文本生成模型、二分类模型和实体抽取模型。
[0015]在本专利技术的一些实施例中,基于所述历史影像报告构建第一样本数据集、第二样本数据集、第三样本数据集以及第四样本数据集,包括:
[0016]获取历史影像报告中的第二影像表现文本和第二影像结论文本;
[0017]将获取到的所述第二影像表现文本和第二影像结论文本进行预处理;
[0018]基于预处理后的所述第二影像表现文本和第二影像结论文本构建第一样本数据集、第二样本数据集、第三样本数据集以及第四样本数据集;
[0019]其中,所述第一样本数据集中的样本数据包括身体部位的类别信息和结构化文本信息,所述第二样本数据集中的样本数据包括文本摘要对,所述第三样本数据集中的样本数据包括影像表现文本摘要和文本表征类型,所述第四样本数据集中的样本数据包括第二实体和所属类型。
[0020]在本专利技术的一些实施例中,所述文本分类模型、文本生成模型、二分类模型和实体抽取模型分别为fasttext模型、pointer

generator模型、bert模型和BiLSTM

CRF模型。
[0021]在本专利技术的一些实施例中,基于历史影像报告构建知识图谱,包括:
[0022]获取历史影像报告中的第二影像表现文本和第二影像结论文本;
[0023]对所述第二影像表现文本和第二影像结论文本中的第二实体进行标注,所述第二实体的类型包括疾病、诊断建议、身体部位、异常症状、正常症状;
[0024]对不同历史影像报告中表征相同内容的第二实体进行对齐操作,并将对齐的第二实体所包含的信息进行融合;
[0025]基于对齐操作后且信息融合后的多个第二实体构建知识图谱。
[0026]在本专利技术的一些实施例中,所述方法还包括:
[0027]将所述知识图谱采用图数据库进行存储,所述图数据库为Neo4j、3store、DLDB、或Jena。
[0028]在本专利技术的一些实施例中,
[0029]将对齐的第二实体所包含的信息进行融合,包括:
[0030]基于字符串相似度模型计算对齐的第二实体所包含的信息的字符串相似度;
[0031]基于语义相似性模型计算对齐的第二实体所包含的信息的语义相似度;
[0032]将所述字符串相似度和所述语义相似度进行融合得到融合相似度;
[0033]其中,所述字符串相似度模型采用的计算公式为:
[0034][0035]其中,sim
str
(x,y)代表实体x和实体y的字符串相似度,x和y分别代表两个字符串相似的实体,P(x)代表对实体x拆解后的字符列表,P(y)代表对实体y拆解后的字符列表;
[0036]所述语义相似性模型采用的计算公式为:
[0037][0038]其中,sim
emb
(x,y)表示实体x和实体y的语义相似度,x
i
表示实体x的词向量中的第i个值,yi表示实体y的词向量中的第i个值,n表示词向量中的元素的个数。
[0039]在本专利技术的一些实施例中,所述融合相似度的计算公式为:
[0040][0041]其中,sim(x,y)表示第二实体x和第二实体y的融合相似度,表示权重系数。
[0042]根据本专利技术的另一方面,本专利技术还公开了一种基于知识图谱的PET/CT影像报告结论辅助生成系统,该系统包括处理器和存储器,所述存储器中存储有计算机指令,所述处理器用于执行所述存储器中存储的计算机指令,当所述计算机指令被处理器执行时该系统实现如上任一实施例所述方法的步骤。
[0043]根据本专利技术的另又一方面,本专利技术还公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上任本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的PET/CT影像报告结论辅助生成方法,其特征在于,所述方法包括:获取待预测的PET/CT影像数据,所述PET/CT影像数据包括第一影像表现文本信息;将所述第一影像表现文本信息输入至训练好的文本分类模型中,得到以不同身体部位为类别的结构化文本分类结果;将所述结构化文本分类结果输入至训练好的文本生成模型中,得到各类别的身体部位对应的影像表现文本摘要,并将所述影像表现文本摘要输入至训练好的二分类模型中,得到影像异常表现摘要;基于历史影像报告构建知识图谱;将所述第一影像表现文本信息输入至训练好的实体抽取模型中,得到所述第一影像表现文本信息的第一实体,基于所述第一实体和知识图谱确定所述第一影像表现文本信息对应的诊断建议文本和疾病类型文本;将所述影像异常表现摘要、诊断建议文本和疾病类型文本作为所述待预测的PET/CT影像数据的第一影像结论文本。2.根据权利要求1所述的基于知识图谱的PET/CT影像报告结论辅助生成方法,其特征在于,所述方法还包括:基于所述历史影像报告构建第一样本数据集、第二样本数据集、第三样本数据集以及第四样本数据集;基于所述第一样本数据集、第二样本数据集、第三样本数据集以及第四样本数据集分别对第一网络模型、第二网络模型、第三网络模型和第四网络模型进行预训练,得到训练好的文本分类模型、文本生成模型、二分类模型和实体抽取模型。3.根据权利要求2所述的基于知识图谱的PET/CT影像报告结论辅助生成方法,其特征在于,基于所述历史影像报告构建第一样本数据集、第二样本数据集、第三样本数据集以及第四样本数据集,包括:获取历史影像报告中的第二影像表现文本和第二影像结论文本;将获取到的所述第二影像表现文本和第二影像结论文本进行预处理;基于预处理后的所述第二影像表现文本和第二影像结论文本构建第一样本数据集、第二样本数据集、第三样本数据集以及第四样本数据集;其中,所述第一样本数据集中的样本数据包括身体部位的类别信息和结构化文本信息,所述第二样本数据集中的样本数据包括文本摘要对,所述第三样本数据集中的样本数据包括影像表现文本摘要和文本表征类型,所述第四样本数据集中的样本数据包括第二实体和所属类型。4.根据权利要求2所述的基于知识图谱的PET/CT影像报告结论辅助生成方法,其特征在于,所述文本分类模型、文本生成模型、二分类模型和实体抽取模型分别为fasttext模型、pointer

generator模型、bert模型和BiLSTM

【专利技术属性】
技术研发人员:王红熳魏浩彬杨放春
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1