一种基于多模态异构数据的肺部疾病自动识别方法及装置制造方法及图纸

技术编号：37988441 阅读：14 留言：0更新日期：2023-06-30 10:03

本发明专利技术提供了一种基于多模态异构数据的肺部疾病自动识别方法及装置，其中方法包括：使用全局统一的文字嵌入特征，对非结构化的文本数据进行预处理；对结构化的文本数据进行预处理；使用结构的影像特征提取模型对医疗影像数据进行特征提取，得到影像特征，其中，结构的影像特征提取模型使用transformer结构作为主干模型；进行词汇之间的关系映射表达；进行多个维度的特征提取和分析，对多模态数据进行特征融合，多模态数据包括对非结构化的文本数据进行预处理和对结构化的文本数据进行预处理得到的文本特征与影像特征；对融合后的特征进行分类，得到输出结果。得到输出结果。得到输出结果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多模态异构数据的肺部疾病自动识别方法及装置

[0001]本专利技术涉及计算机领域，尤其涉及一种基于多模态异构数据的肺部疾病自动识别方法及装置。

技术介绍

[0002]随着医疗信息化的快速发展和医疗设备的更新迭代，海量多样的医疗数据应运而生，其大致可以被分为临床文本数据和影像数据。文本数据主要包括血红蛋白、尿常规、基因检测结果等结构化的检验数据，以及医生记录的患者主诉、病理文本等非结构化的文本数据；影像数据则包括超声图像、CT图像、X光、核磁共振图像等影像数据和心电图、脑电图等信号数据。目前，大多数人工智能在医学上的应用都是使用单模态数据来处理特定的任务，例如计算机断层扫描显像(CT)和视网膜图像的单疾病诊断，该方法忽视了更广泛的临床背景环境，这不可避免的削弱了人工智能模型的潜力。相比之下，对于临床医生在诊断肺部感染、进行预后评估和决定治疗计划时，往往会处理来自多个源的多模态的数据。不同模态的医学数据从不同的特定角度提供了患者的诊疗信息，结合多种类的医学信息进一步提高了诊断治疗的准确性，使得人工智能更加接近临床实践。然而，从理论上讲，人工智能模型也应该能够使用所有临床医生通常可以获得的数据资源，甚至是大多数临床医生无法获得的资源(例如，大多数普通临床医生往往没有审阅诊断成千上万份来自不同地区，不同医院，不同科室的多模态数据)，而不同模态的数据集成往往会增加诊断的鲁棒性和准确性。然而，不同模态数据之间的信息是互补和冗余的，如何有效利用不同模态之间的互补信息，弥补自身模态的缺陷，减少模态之间冗余信息的影响，提高对病...

【技术保护点】

【技术特征摘要】
1.一种基于多模态异构数据的肺部疾病自动识别方法，其特征在于，包括：使用全局统一的文字嵌入特征，对非结构化的文本数据进行预处理；对结构化的文本数据进行预处理；使用结构的影像特征提取模型对医疗影像数据进行特征提取，得到影像特征，其中，所述结构的影像特征提取模型使用transformer结构作为主干模型；进行词汇之间的关系映射表达；进行多个维度的特征提取和分析，对多模态数据进行特征融合，所述多模态数据包括对非结构化的文本数据进行预处理和对结构化的文本数据进行预处理得到的文本特征与所述影像特征；对融合后的特征进行分类，得到输出结果。2.根据权利要求1所述的方法，其特征在于，所述对非结构化的文本数据进行预处理包括：使用规则导向的结构化算法对所述非结构化的文本数据进行转换。3.根据权利要求1所述的方法，其特征在于，所述对结构化的数据进行预处理包括：判断预设数值是否在合理区间内，对于不同数量级的数据进行归一化。4.根据权利要求1所述的方法，其特征在于，所述结构的影像特征提取模型包括：多个多层编码器，每个所述编码器的输入先流入Self
‑
Attention层，卷积核为16*16的卷积核。5.根据权利要求1所述的方法，其特征在于，所述结构的影像特征提取模型包括：基于征象的异常检测模型和基于疾病的诊断模型，其中，使用所述基于征象的异常检测模型对所述基于疾病的诊断模型进行特征增强。6.根据权利要求1所述的方法，其特征在于，所述进行多个维度的特征提取和分析，对多模态数据进行特征融合包括：利用多模态注意力融合机制进行特征融合，所述多模态注意力融合机制表示为：其中，Y(i)表示某一个形符和其他所有形符之间的关系输出，x
i
和y
j
表示在该融合的向量的其中两个形符；i代表计算其响应的输出为止的索引，j是枚举所有可能位置的索引；θ(x
i
,y
j
)计算两个不同特征位置之间的关系；g(x
j
)计算位置j处的特征；最后，通过标准化处理1/C(x)最终的关系结果。7.一种基于多模态异构数据的肺部疾病自动识别装置，其特征在于，包括：数据结构化模块，用于使用全局统一的文...

【专利技术属性】
技术研发人员：俞益洲，马杰超，张树，李一鸣，乔昕，
申请(专利权)人：杭州深睿博联科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人