【技术实现步骤摘要】
多模态疾病特征的提取方法及装置
[0001]本申请涉及数据处理
,具体涉及一种多模态疾病特征的提取方法及装置。
技术介绍
[0002]人工智能技术在开展辅助诊疗、药物研发等问题的研究上,推动了医疗技术的进步,使得智能诊断能帮助医生对病人进行更全面的疾病预测,并且能够防止医生基于经验造成的漏诊问题。然而,对于同一疾病,不同患者往往具有不同的表现,某些不典型的疾病特征同样具有极大的临床参考意义,而当前基于机器学习仅仅提取某些疾病相关特征的方法标注工作耗时耗力、纳入特征十分局限,大大阻碍了模型性能及其临床应用能力的提升。因此,在辅助医生进行疾病预测上,如何进行医学数据处理,以实现精准的疾病预测,是目前亟需解决的问题。
技术实现思路
[0003]本申请实施例提供一种多模态疾病特征的提取方法及装置,以解决人工标注疾病特征导致的态疾病特征的提取效率较低的技术问题。
[0004]一方面,本申请提供一种多模态疾病特征的提取方法,包括:采集目标疾病的历史患者的疾病数据,所述疾病数据包括所述患者在第一医院的病历文本、在第一医院的医学检查图像和多模态补充数据;将所述病历文本按照不同疾病描述维度进行词句拆分,得到所述目标疾病的疾病描述词句集合;按照不同疾病描述维度对所述疾病描述词句集合的疾病描述词句进行标记,得到标记后的疾病描述词句集合;对所述标记后的疾病描述词句集合中不同疾病描述维度下的词句进行词句关联,得到所述目标疾病的疾病文本特征;对所述医学检查图像进行特征提取,得到所述目标疾病的辅助图像特征;对所述多模 ...
【技术保护点】
【技术特征摘要】
1.一种多模态疾病特征的提取方法,其特征在于,所述方法包括:采集目标疾病的历史患者的疾病数据,所述疾病数据包括所述患者在第一医院的病历文本、在第一医院的医学检查图像和多模态补充数据;将所述病历文本按照不同疾病描述维度进行词句拆分,得到所述目标疾病的疾病描述词句集合;按照不同疾病描述维度对所述疾病描述词句集合的疾病描述词句进行标记,得到标记后的疾病描述词句集合;对所述标记后的疾病描述词句集合中不同疾病描述维度下的词句进行词句关联,得到所述目标疾病的疾病文本特征;对所述医学检查图像进行特征提取,得到所述目标疾病的辅助图像特征;对所述多模态补充数据进行特征提取,得到所述目标疾病的多模态补充特征;将所述疾病文本特征、所述辅助图像特征和多模态补充特征合并,得到所述目标疾病的疾病特征。2.如权利要求1所述的多模态疾病特征的提取方法,其特征在于,每个所述疾病描述维度对应一个维度标注;所述对所述标记后的疾病描述词句集合中不同疾病描述维度下的词句进行词句关联,得到所述目标疾病的疾病文本特征,包括:分别以不同疾病描述维度下的词句作为目标词句,计算所述目标词句与各个疾病描述维度对应的维度标注的关联度,得到多个标注关联度;选取所述标注关联度大于预设阈值的所述维度标注作为目标维度标注;将所述目标维度标注对应的疾病描述维度下的词句与所述目标词句进行关联,得到所述目标疾病的疾病文本特征。3.如权利要求1所述的多模态疾病特征的提取方法,其特征在于,所述医学检查图像包括CT图像、MRI图像、B超图像、病理图像;所述对所述医学检查图像进行特征提取,得到所述目标疾病的辅助图像特征,包括:分别对所述CT图像、所述MRI图像、所述B超图像及所述病理图像进行特征提取,得到各自对应的CT图像特征、MRI图像特征、B超图像特征、病理图像特征;将所述CT图像特征、所述MRI图像特征、所述B超图像特征及所述病理图像特征合并,得到所述目标疾病的辅助图像特征。4.如权利要求3所述的多模态疾病特征的提取方法,其特征在于,所述分别对所述CT图像、所述MRI图像、所述B超图像及所述病理图像进行特征提取,得到各自对应的CT图像特征、MRI图像特征、B超图像特征、病理图像特征,包括:采用预设的DarkNet
‑
53网络模型对所述CT图像进行特征编码,得到所述CT图像特征;采用预设的金字塔模型对所述MRI图像进行特征提取,得到所述MRI图像特征;采用预设的Lasso回归模型对所述B超图像进行特征提取,得到所述B超图像特征;采用预设的CBAM
‑
CNN网络模型对所述病理图像进行特征提取,得到所述病理图像特征。5.如权利要求1所述的多模态疾病特征的提取方法,其特征在于,所述多模态补充数据包括来自所述历史患者的语音数据,所述多模态补充特征包括语音补充特征;所述对所述多模态补充数据进行特征提取,得到所述目标疾病的多模态补充特征,包
括:将所述语音数据通过预设的语音识别模型转换为文本数据,得到文本补充数据;基于预设的文本识别方法,提取所述文本补充数据中的疾病特征,得到第一语音补充特征;采用预设的语音分类方式对所述语音数据进行疾病特征提取,得到第二语音补充特征;将所述第一语音补充特征和所述第二语音补充特征合并,得到所述目标疾病的语音补充特征。6.如权利要求1所述的多模态疾病特征的提取方法,其特征在于,所述多模态补充数据包括来自所述历史患者的文本补充数据,所述多模态补充特征包括文本补充特征;所述采集目标疾病的历史患者的疾病数据,包括:扫描所述历史患者在第二医院的纸质疾病记录文本,得到所述文本补充数据,所述第一医院和第二医院为不同医院;所述对所述多模态补充数据进行特征提取,得到所述目标疾病的多模态补充特征,包括:将所述文本补充数据按照不同疾病描述维度进行词句拆分,得到所述目标疾病的补...
【专利技术属性】
技术研发人员:于红刚,张晨霞,姚理文,
申请(专利权)人:武汉大学人民医院湖北省人民医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。