【技术实现步骤摘要】
一种医学知识增强的图文预训练系统及方法
[0001]本专利技术涉及医学人工智能
,具体是一种医学知识增强的图文预训练系统及方法。
技术介绍
[0002]预训练系统是解决深度学习算法泛用性、降低数据需求的重要途径,尤其是利用图文多模态数据进行预训练。在过去几年中,图文预训练
‑
微调的范式在自然图像领域取得了巨大成功。但在医疗这一特定场景下,通用的预训练系统却表现平平,造成这一点的原因主要来自于医学场景具有数据稀缺、专业知识依赖、可解释性要求高等特点。
[0003]经检索,发表于2022年欧洲计算机视觉国际会议(ECCV),公开网址为https://arxi v.org/abs/2204.09817的论文“Maki ng the Most of Text Semant i cs to Improve Bi omed i ca l Vi s i on
–
Language Process i ng”提出了一种基于报告文本特性的医疗图文预训练算法。其在预训练阶段,首先利用了报告文本中的语序无关性进行了文本增强,再利用报告中结论与发现的对应关系,采用经典对比学习的方式对预训练系统中的文本编码器进行了重新调整,最后再利用文本与图像的成对数据,还是利用对比学习的方式,完成整个预训练系统的训练。
[0004]现有技术存在如下缺点数据依赖性高。目前的方法大多直接处理原始文本,并利用图文是否匹配作为粗糙的监督信号。这导致现有的方法需要大量的数据对来提供充足的信息理解文本;无法理解专 ...
【技术保护点】
【技术特征摘要】
1.一种医学知识增强的图文预训练系统,其特征在于,所述系统包括:数据获取模块,用于获取一辆数据中的文本
‑
图像数据对;三元组化理模块;用于对于数据获取模块的医学文本进行三元组化的预处理,其中三元组包含三个部分:实体名称、实体位置、实体存在与否;多模态融合训练模块,用于对图像进行编码并结合实体描述内容,通过融入编码器。2.根据权利要求1所述的一种医学知识增强的图文预训练系统,其特征在于,所述三元组化处理模块包括:实体文本抽取模块,用于进行实体文本数据抽取并概括为实体三元合集;实体文本转化模块,用于对实体名称以及实体位置分别转化为对应医学高度专业的医学描述语句和位置语句;医学文本编码器,所述已选文本编码器用于对实体描述以及示意位置语句进行编码,得出编码三元组。3.根据权利要求2所述的一种医学知识增强的图文预训练系统,其特征在于,所述多模态融合训练模块包括:图像编码器,用于对图像信息进行编码;融合编码器,用于结合编码三元组以及图像编码进行融合对比输出训练结果。4.一种基于权利要求1
‑
3所述医学知识增强的图文预训练系统,其特征在于,所述方法包括:步骤S1获取医疗数据中的文本
‑
图像数据对;步骤S2对于医学文本进行三元组化的预处理,得到编码三元组;步骤S3对医疗数据中的图像进行编码处理,并结合编码信息进行预测判断,同时结合编码三元组对输出结果进行监督,完成训练。5.根据权利要求4所述的一种医学知识增强的图文预训练方法,其特征在于,所述步骤S2详细内容如下:步骤S2.1,基于医学文本实体抽取方法,对所述数据对进行处理,获得能够概括文本内容的实体三元组集合;步骤S2.2对于三元组中的实体名称,利用额外的医学知识库,将实体名称进一步转化为医学高度专业的医学描述语句;步骤S2.3对于三元组中的实体位置,利用一个文本模板,将位置单词实体转为位置语句;步骤S2.4对三元组进行了如上转换后,利用医学文本编码器Φ
Text
,对实体描述以及位置语句进行编码,并将三元组中的实体存在与否转化外0/1的数字信息,从而获得编码后的编码三元组...
【专利技术属性】
技术研发人员:王延峰,吴超逸,张小嫚,谢伟迪,张娅,
申请(专利权)人:上海交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。