一种基于文本检索的可解释性智慧医疗辅助诊断系统技术方案

技术编号:28147981 阅读:57 留言:0更新日期:2021-04-21 19:35
本发明专利技术公开了一种基于文本检索的可解释性智慧医疗辅助诊断系统,包括:查询预处理模块,用于对病人病历进行预处理,得到与患病信息相关的查询词;知识图谱构建模块,用于与查询词结合形成一个新的关于特定疾病的知识图谱;文本检索模块,用于通过查询词以及新的知识图谱来检索医学数据库中与查询词相关的以往的病例及治疗方案;可解释的辅助诊断模块,用于解释检索出与病人病历相关的病例及治疗方案的原因。本发明专利技术可有效解决长文档长距离依赖的语义编码问题,以及将知识图谱很好地融入到查询词中,并通过知识图谱上和预训练的自注意力模型的权重值得到与查询词相关的实体信息或者文档片段,从而为智慧诊断提供更为精准的可解释性结果。的可解释性结果。的可解释性结果。

【技术实现步骤摘要】
一种基于文本检索的可解释性智慧医疗辅助诊断系统


[0001]本专利技术涉及文本检索的
,尤其是指一种基于文本检索的可解释性智慧医疗辅助诊断系统。

技术介绍

[0002]随着计算机领域的飞速发展,各行业与计算机结合越来越深。借助计算机可以利用行业内的数据进行数据挖掘,数据分析。尤其是在医学领域,近年来计算机领域里的深度学习方法可以从海量数据中提取原始特征,然后发现这些原始特征背后的规律,从而解决复杂问题。随着技术的发展和计算能力的增强,深度学习在医疗领域的应用越来越广泛,智慧医疗已经在病例分析、疾病预测中获得初步成果,但深度学习模型属于黑盒子性质,即可解释性较差,不能给出哪些数据对于医疗诊断起了决定作用,因此医生对于医疗诊断结果不能完全相信,这样妨碍计算机技术用于生物医学领域。智慧医疗辅助诊断的可解释性模型就是提供疾病诊断结果的可解释性,即诊断疾病时,不仅仅是单纯给出诊断结果,还需要给出相关解释,例如诊断结果的由来,相关的案例等。
[0003]本专利运用文本检索技术,通过病例诊断结果或生物医学文献检索出相关的病例信息,从中找到以往的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于文本检索的可解释性智慧医疗辅助诊断系统,其特征在于,包括:查询预处理模块,用于对病人病历进行预处理,得到与患病信息相关的查询词;知识图谱构建模块,用于与查询词结合形成一个新的关于特定疾病的知识图谱;文本检索模块,用于通过查询词以及新的知识图谱来检索医学数据库中与查询词相关的以往的病例及治疗方案;可解释的辅助诊断模块,用于解释检索出与病人病历相关的病例及治疗方案的原因。2.根据权利要求1所述的一种基于文本检索的可解释性智慧医疗辅助诊断系统,其特征在于:所述查询预处理模块对病人病历进行的预处理包括分词、去标点符号、去停用词和拼写纠正,然后通过语法解析保留名词短语和动词短语,将其作为后续知识图谱融合的实体。3.根据权利要求1所述的一种基于文本检索的可解释性智慧医疗辅助诊断系统,其特征在于:所述知识图谱构建模块通过从查询预处理模块中获得的名词短语和动词短语,从现有的生物医学领域知识图谱获得实体概念、语义解释和语义类型,通过知识融合,从现有的知识图谱中,抽取与查询词有关的子图,并融合形成新的特定疾病的知识图谱G,该知识图谱G定义为:G={(h,r,t)|h,t∈ε,r∈R}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)式中,ε和R分别是集成图谱实体集合和关系集合;而三元组(h,r,t)表示这样的一条事实知识:头实体h与尾实体t之间存在着关系r。4.根据权利要求1所述的一种基于文本检索的可解释性智慧医疗辅助诊断系统,其特征在于:所述文本检索模块包括词嵌入表示模块、图嵌入表示模块和文本匹配模块;所述词嵌入表示模块利用预训练的自注意力模型来分别获得待检索病历与查询词的词嵌入表示;所述预训练的自注意力模型是一个12层的transformer的堆叠结构,其中第i层transformer的公式如(2)、(3)、(4)所示:M
i
=LN(S
i
‑1+O
i
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)公式(2)中的Q、K、V是查询词或者待检索的病历,是一个二维矩阵,分别是Q、K、V的二维的权重矩阵,d
k
是的其中一维的大小,是缩放值,softmax是归一化操作,O
i
是通过词与词之间的相似度累加得到的序列向量;公式(3)中LN代表一个残差网络,S
i
‑1是第i

1层的输入,在第一层指的是查询词或者待检索病历,M
i
是残差网络的输出;公式(4)是两层全连接层,其中W
1i
、是权重矩阵,是偏置,ReLU是激活函数,S
i
是一层transformer的输出,即新的词向量嵌入表示;所述图嵌入表示模块利用图注意力网络将特定疾病的知识图谱上查询词的词嵌入表示变为查询词的图嵌入表示,通过图注意力网络学习查询词在新的知识图谱的特征表示,其本质是图注意力网络通过对一个节点本身及在知识图谱上该节点的邻居给予不同的权重,学习得到一个新节点的特征表示;首先,知识图谱上所有节点的...

【专利技术属性】
技术研发人员:董守斌刘晓峰胡金龙袁华
申请(专利权)人:中山依数科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1