抗后门攻击的智能医疗影像诊断意见自动生成方法技术

技术编号:37169687 阅读:24 留言:0更新日期:2023-04-20 22:41
本发明专利技术公开一种抗后门攻击的智能医疗影像诊断意见自动生成方法,包括以下步骤:获取影像表现数据,并对影像表现数据进行数据预处理,得到样本数据;以有标签的样本数据作为输入数据,以及以诊断意见作为输出数据建立基于深度学习的医疗影像诊断意见自动生成模型;使用字符级别的触发器对医疗影像诊断意见自动生成模型注入攻击样本,利用n

【技术实现步骤摘要】
抗后门攻击的智能医疗影像诊断意见自动生成方法


[0001]本专利技术涉及医疗影像报告自动生成
,尤其涉及一种抗后门攻击的智能医疗影像诊断意见自动生成方法。

技术介绍

[0002]在医疗影像报告生成的过程中,影像诊断意见需要专业的影像医师进行撰写,往往花费大量的时间。随着科技的发展,基于深度学习的医疗影像诊断意见自动生成,立足于医疗影像分析和诊断报告自动生成技术,能够利用深度神经网络,能够智能化、自动化的生成诊断意见。该技术能实现系统化、精准化、智能化的计算机辅助诊疗服务和健康管理的研究,极大程度上减少影像医师的工作压力,提高工作效率,从而减少医疗影像采集的时间,缓解部分医疗资源紧张的问题。
[0003]现有的针对医疗影像诊断意见自动生成算法,虽然能够生成高质量的诊断意见,但难以抵御后门攻击,一旦输入样本被注入后门攻击触发器,模型性能将出现大幅度的下降。对抗训练虽然能够一定程度上缓解后门攻击的问题,但存在效率低下、性能差等问题。考虑到医疗影像诊断意见自动生成是智能医疗的重要研究方向,因此,研究一种能够抗后门攻击的医疗影像诊断意见自动生成的新方法是迫切需要的。

技术实现思路

[0004]针对上述问题,本专利技术提出一种抗后门攻击的智能医疗影像诊断意见自动生成方法,旨在解决现有的医疗影像诊断意见自动生成算法无法有效抵御后门攻击的问题,以提高模型的安全性、确保生成的诊断意见的质量,以及实现自动抵御后门攻击的智能医疗的目的。
[0005]为解决上述技术问题,本专利技术第一方面提出一种抗后门攻击的智能医疗影像诊断意见自动生成方法,包括以下步骤:获取影像表现数据,并对所述影像表现数据进行数据预处理,得到样本数据;以有标签的所述样本数据作为输入数据,以及以诊断意见作为输出数据建立基于深度学习的医疗影像诊断意见自动生成模型;使用字符级别的触发器对所述医疗影像诊断意见自动生成模型注入攻击样本,利用n

gram算法找寻并过滤所述攻击样本中的错误词语并给予纠错建议,并结合对抗训练进一步提升所述医疗影像诊断意见自动生成模型的抗攻击性。
[0006]本专利技术第二方面提出一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行,以实现上述的抗后门攻击的智能医疗影像诊断意见自动生成方法。
[0007]本专利技术第三方面提出一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集
或指令集由处理器加载并执行以实现上述的抗后门攻击的智能医疗影像诊断意见自动生成方法。
[0008]本专利技术的有益效果为:根使用字符级别的触发器对医疗影像诊断意见自动生成模型注入攻击样本,利用n

gram算法找寻并过滤攻击样本中的错误词语并给予纠错建议,从而抵御后门攻击,然后将触发器过滤算法和对抗训练相结合,在数据层面和模型训练层面多维度的自动抵御后门攻击。
附图说明
[0009]图1为传统医疗影像和对应的诊断意见的示意图;图2为本专利技术实施例一公开的抗后门攻击的智能医疗影像诊断意见自动生成方法的流程示意图;图3为本专利技术实施例一公开的医疗影像诊断意见自动生成模型的流程示意图;图4为本专利技术实施例一公开的使用p

softmax算法后概率输出对比示意图;图5为本专利技术实施例一公开的使用p

softmax算法后概率可视化示意图;图6为本专利技术实施例一公开的步骤S3的流程示意图;图7为本专利技术实施例二公开的电子设备的结构示意图。
具体实施方式
[0010]为使本专利技术的目的、技术方案及优点更加清楚、明确,下面结合附图和具体实施方式对本专利技术的内容做进一步详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。
[0011]以下对本申请实施例中的部分用语进行解释说明,以便于本领域技术人员理解。
[0012]预训练语言模型:预训练通过自监督学习从大规模数据中获得与具体任务无关的预训练模型。体现某一个词在一个特定上下文中的语义表征。预训练模型是一种迁移学习的应用,利用几乎无限的文本,学习输入句子的每一个成员的上下文相关的表示,它隐式地学习到了通用的语法语义知识。预训练可以将从开放领域学到的知识迁移到下游任务,以改善低资源任务,对低资源语言处理非常有利。由于现有的预训练模型多是英文且非医疗领域,因此本专利技术中的医疗预训练语言模型具体是指针对中文医疗影像诊断意见自动生成系统的预训练。
[0013]微调训练语言模型:针对具体的任务修正网络。通常来说训练数据可以是文本、文本与图像对、文本与视频对。预训练模型可经过微调之后,用于支持分类、序列标记、结构预测和序列生成等各项技术,并构建文摘、机器翻译、图片检索、视频注释等应用。本专利技术中的微调预训练语言模型具体是指针对医疗影像诊断意见自动生成的网络微调。
[0014]UNILM结构:UNILM是在BERT预训练模型的基础上,最新产出的预训练语言模型,被称为统一预训练语言模型。使用三种特殊的Mask的预训练目标,它可以完成单向、序列到序列和双向预测任务,可以说是结合了众多语言模型的优点,UNILM在抽象摘要、生成式问题回答和语言生成数据集的抽样领域取得了优秀的成绩。本专利技术是将UNILM结构应用于智能医疗领域的首次尝试。
[0015]模型的输入、输出:不同于传统深度学习生成类任务,医疗影像诊断意见生成模型的输入、输出分别由诊断发现和诊断意见构成。诊断发现作为模型的输入,指的是影像检查中对患者疾病的表述,主要包括患者检查部位的描述、患者疾病描述、以及患者多次检查情况对比的描述;诊断意见作为模型的输出,指的是对患者疾病的重点描述,是诊断发现内容的凝练,必要时需要给予患者一定的诊疗建议。
[0016]对抗训练:对抗训练本质是为了提高模型的鲁棒性,作为一种防御对抗攻击的方法,其思路是将生成的对抗样本加入到训练集中,让模型在训练的时候就先学习一遍对抗样本。一方面能起到数据增强的效果,另一方面能够提高模型的鲁棒性、抗攻击能力。
[0017]本专利技术期望解决现有医疗影像诊断意见自动生成技术中的抵御后门攻击能力差的问题,现有的算法注重生成诊断意见的质量,以及生成诊断意见的速率,而忽略了后门攻击带来的隐形安全隐患。本专利技术的算法能够有效利用触发器过滤算法和对抗训练,从数据层面和模型训练层面多维度的抵御后门攻击,进而在保证生成诊断意见质量的同时,实现了抵御后门攻击的目的。
[0018]传统医患诊疗过程中,医疗影像中的诊断意见需要由医生根据影像特征,结合专业知识及自身积累的经验撰写,如图1所示。手动撰写诊断意见往往需要大量的时间,不利于缓解医疗资源紧张的问题。而本专利技术基于人工智能及深度学习能够智能化本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种抗后门攻击的智能医疗影像诊断意见自动生成方法,其特征在于,包括以下步骤:获取影像表现数据,并对所述影像表现数据进行数据预处理,得到样本数据;以有标签的所述样本数据作为输入数据,以及以诊断意见作为输出数据建立基于深度学习的医疗影像诊断意见自动生成模型;使用字符级别的触发器对所述医疗影像诊断意见自动生成模型注入攻击样本,利用n

gram算法找寻并过滤所述攻击样本中的错误词语并给予纠错建议,并结合对抗训练进一步提升所述医疗影像诊断意见自动生成模型的抗攻击性。2.如权利要求1所述的抗后门攻击的智能医疗影像诊断意见自动生成方法,其特征在于,所述数据预处理包括数据脱敏化处理、数据拆分和数据长度限制。3.如权利要求2所述的抗后门攻击的智能医疗影像诊断意见自动生成方法,其特征在于,所述数据脱敏化处理包括:利用正交匹配算法对所述影像表现数据中的患者信息进行筛选,得到不含所述患者信息的所述影像表现数据;所述数据拆分包括;对不含所述患者信息的所述影像表现数据中包含患者检查部位的描述、患者疾病描述,以及患者多次检查情况对比描述元素进行拆分;数据长度限制包括:对拆分后的所述影像表现数据进行截断或者填补操作,得到数据长度统一的所述样本数据。4.如权利要求1所述的抗后门攻击的智能医疗影像诊断意见自动生成方法,其特征在于,所述医疗影像诊断意见自动生成模型的建立过程包括:以BERT作为基础网络建立预训练语言模型,将无标签的所述样本数据输入所述预训练语言模型进行训练,获得以中文医学专业术语为目标的所述预训练语言模型;以所述预训练语言模型为基础,结合有标签的所述样本数据,使用UNILM策略进行微调,建立所述医疗影像诊断意见自动生成模型,深度挖掘输出影像表现和患者病理之间的关联特征,并将所述关联特征转换为相应的特征数据,通过深度学习模型解码输出所述特征数据;利用Copy机制对输入的所述样本数据中的专业术语直接进行复制,通过所述医疗影像诊断意见自动生成模型输出所述诊断意见;使用稀疏优化算法优化所述医疗影像诊断意见自动生成模型的激活函数。5.如权利要求4所述的抗后门攻击的智能医疗影像诊断意见自动生成方法,其特征在于,经过优化后的所述激活函数为:,其中,为所述激活函数的输出,为对数运算,为概率子集,表示概率值,为原始激活函数。6.如权利要求1所述的抗后门攻击的智能医疗影像诊断意见自动生成方法,其特征在于,所述利用n

gram算法找寻并过滤...

【专利技术属性】
技术研发人员:温金明赵帅何梓濠张雨林李庆
申请(专利权)人:人工智能与数字经济广东省实验室广州
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1