以医疗数据为基础的深度学习模型的学习及推论方法、程序及装置制造方法及图纸

技术编号：41304147 阅读：2 留言：0更新日期：2024-05-13 14:50

本发明专利技术的一实施例涉及由计算装置执行的以医疗数据为基础的深度学习模型的学习及推论方法、程序及装置。所述学习方法可包括下列步骤：以医疗数据为基础让第一神经网络模型学习；以及把表示所述已学习的第一神经网络模型所含神经网络块(block)的第一运算函数(operation function)和表示第二神经网络模型所含神经网络块的第二运算函数予以匹配，从而以所述已学习的第一神经网络模型为基础让所述第二神经网络模型学习。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】

本专利技术的内容涉及一种医疗领域的深度学习技术，具体地，涉及一种利用归纳偏置传递(inductive bias transfer)让深度学习模型学习并且把已学习的深度学习模型应用于医疗领域的方法。

技术介绍

1、为了深度学习模型的泛化(generalization)而需要使用大量数据。例如，现有变换器(transformer)模型之一使用3亿数据点的额外数据在图像网(imagenet)基准(benchmark)发挥出高于其它基于卷积(convolution)的接近方式的性能。然而，在所有的域(domain)确保大数据不容易。因此，在获取大量数据时需要花费庞大成本的诸如医疗领域之类的域(domain)中深度学习模型的使用依然受到了限制。

2、很多研究人员提出了下述解决方案，即，不依靠庞大数据数量地把深度学习模型泛化问题予以缓和的解决方案。解决方案之一是以知识蒸馏(knowledge distillation)为基础的数据高效图像变换器(deit，data efficient image transformer)。数据高效图像变换器(deit)把卷积神经网络作为变换器(transformer)的教师(teacher)使用，采取了通过额外的令牌(token)把在泛化性能中发挥重要作用的卷积神经网络的知识蒸馏到变换器(transformer)的方式。数据高效图像变换器(deit)假设能通过该蒸馏方式把卷积神经网络的归纳偏置(inductive bias)编码(encoding)到变换器(transformer)而提高性能。</p>

3、即使如此，为了进行知识蒸馏，数据高效图像变换器(deit)也需要掌握一定数量以上的数据。因此，数据高效图像变换器在用于知识蒸馏的数据类数量积累不足的医疗领域难以应用。例如，评估双重意图与实体变换器(diet)性能时，先前使用的图像网由一千个类别组成，与此相反，心电图数据、电子健康记录(ehr：electronic health records)数据之类的医疗数据仅仅包含着数十乃至数十个类别。有鉴于成功的知识传递依靠教师的信号品质，各式各样的信号则对教师很重要，使用双重意图与实体变换器时教师模型的归纳偏置虽然能在图像网成功地传递，但是在医疗数据却无法传递。

技术实现思路

1、技术问题

2、本专利技术旨在解决前述
技术介绍
的问题，本专利技术的目的是提供一种依靠医疗领域的少量数据集也能有效地传递归纳偏置(inductive bias)而让深度学习模型学习的方法以及利用以该学习方法为基础学习的深度学习模型推断各种健康状态的方法。

3、然而，本专利技术需要解决的技术课题不限于前述课题，可以在下面的记载中明确地了解到前面没有提到的其它课题。

4、技术方案

5、实现如前所述的课题的本专利技术的一实施例揭示了由计算装置执行的以医疗数据为基础的深度学习模型的学习方法。所述学习方法可包括下列步骤：以医疗数据为基础让第一神经网络模型学习；以及把表示所述已学习的第一神经网络模型所含神经网络块(block)的第一运算函数(operation function)和表示第二神经网络模型所含神经网络块的第二运算函数予以匹配，从而以所述已学习的第一神经网络模型为基础让所述第二神经网络模型学习。

6、或者，把表示所述已学习的第一神经网络模型所含神经网络块的第一运算函数和表示第二神经网络模型所含神经网络块的第二运算函数予以匹配，从而以所述已学习的第一神经网络模型为基础让所述第二神经网络模型学习的步骤可包括下列步骤，即，利用把所述第一运算函数与所述第二运算函数之间的输入或维度中的至少一个予以匹配的损失函数，以所述已学习的第一神经网络模型为基础让所述第二神经网络模型学习。

7、或者，所述损失函数可包括：第一副损失函数，把对应于所述第一神经网络模型所含第n-1个(n是自然数)神经网络块的第一运算函数的输出作为输入变量；以及第二副损失函数，把对应于所述第二神经网络模型所含第n-1个神经网络块的第二运算函数的输出作为输入变量。此时，所述第一副损失函数及所述第二副损失函数可分别是用于运算对应于所述第一神经网络模型所含第n个神经网络块的第一运算函数的输出和对应于所述第二神经网络模型所含第n个神经网络块的第二运算函数的输出之间的差异的函数。

8、或者，所述第一副损失函数及所述第二副损失函数可分别包括用于把对应于所述第n个神经网络块的第一运算函数和对应于所述第n个神经网络块的第二运算函数的维度予以匹配的变换函数。

9、或者，所述变换函数可包括：第一副变换函数，把所述变换函数的输入变量在时间方向(temporal direction)予以线性变换；以及第二副变换函数，把所述变换函数的输入变量在特征维度(feature dimension)予以线性变换。

10、或者，所述第一副损失函数所含变换函数是把对应于所述第n-1个神经网络块的第一运算函数的输出的维度匹配到对应于所述第n个神经网络块的第二运算函数的输入的维度并且把对应于所述第n个神经网络块的第二运算函数的输出的维度匹配到对应于所述第n个神经网络块的第一运算函数的输出的维度的函数。

11、或者，所述第二副损失函数所含变换函数可以是把对应于所述第n-1个神经网络块的第二运算函数的输出的维度匹配到对应于所述第n个神经网络块的第一运算函数的输入的维度并且把对应于所述第n个神经网络块的第一运算函数的输出的维度匹配到对应于所述第n个神经网络块的第二运算函数的输出的维度的函数。

12、或者，所述损失函数还可包括第三副损失函数，用于运算接收了所述医疗数据的输入的所述第一神经网络模型的输出和接收了所述医疗数据的输入的所述第二神经网络模型的输出之间的差异。

13、或者，所述第三副损失函数可包括把接收了所述医疗数据的输入的所述第一神经网络模型的输出的维度匹配到接收了所述医疗数据的输入的所述第二神经网络模型的输出的维度的变换函数。

14、或者，所述学习方法还可包括以医疗数据为基础对所述第二神经网络模型进行微调(fine tuning)的步骤。此时，所述微调使所述第二神经网络模型的加权值保持着和基于所述已学习的第一神经网络模型的学习处于完毕状态的加权值接近的值，同时让所述第二神经网络模型学习。

15、或者，所述第一神经网络模型可包括卷积(convolutional)神经网络或循环(recurrent)神经网络中的至少一个，所述第二神经网络模型可包括基于自注意力机制(self-attention)的神经网络。

16、或者，所述医疗数据可包括心电图数据或电子健康记录(ehr：electronic healthrecords)数据中的至少一个。

17、另一方面，实现如前所述的课题的本专利技术的一实施例揭示了由计算装置执行的以医疗数据为基础的深度学习模型的推论方法。所述推论方法可包括下列步骤：获取包含心电图数据或电子健康记录数据中的至少一个的医本文档来自技高网...

【技术保护点】

1.一种以医疗数据为基础的深度学习模型的学习方法，由包括至少一个处理器的计算装置执行，其特征在于，包括下列步骤：

2.根据权利要求1所述的以医疗数据为基础的深度学习模型的学习方法，其特征在于，把表示已学习的所述第一神经网络模型所含神经网络块的第一运算函数和表示第二神经网络模型所含神经网络块的第二运算函数予以匹配，从而以已学习的所述第一神经网络模型为基础让所述第二神经网络模型学习的步骤包括下列步骤，即，

3.根据权利要求2所述的以医疗数据为基础的深度学习模型的学习方法，其特征在于，

4.根据权利要求3所述的以医疗数据为基础的深度学习模型的学习方法，其特征在于，所述第一副损失函数及所述第二副损失函数分别包括用于把对应于所述第n个神经网络块的第一运算函数和对应于所述第n个神经网络块的第二运算函数的维度予以匹配的变换函数。

5.根据权利要求4所述的以医疗数据为基础的深度学习模型的学习方法，其特征在于，所述变换函数包括：

6.根据权利要求4所述的以医疗数据为基础的深度学习模型的学习方法，其特征在于，所述第一副损失函数所含变换函数是

7.根据权利要求4所述的以医疗数据为基础的深度学习模型的学习方法，其特征在于，所述第二副损失函数所含变换函数是把对应于所述第n-1个神经网络块的第二运算函数的输出的维度匹配到对应于所述第n个神经网络块的第一运算函数的输入的维度并且把对应于所述第n个神经网络块的第一运算函数的输出的维度匹配到对应于所述第n个神经网络块的第二运算函数的输出的维度的函数。

8.根据权利要求2所述的以医疗数据为基础的深度学习模型的学习方法，其特征在于，所述损失函数还包括第三副损失函数，用于运算接收了所述医疗数据的输入的所述第一神经网络模型的输出和接收了所述医疗数据的输入的所述第二神经网络模型的输出之间的差异。

9.根据权利要求8所述的以医疗数据为基础的深度学习模型的学习方法，其特征在于，所述第三副损失函数包括把接收了所述医疗数据的输入的所述第一神经网络模型的输出的维度匹配到接收了所述医疗数据的输入的所述第二神经网络模型的输出的维度的变换函数。

10.根据权利要求1所述的以医疗数据为基础的深度学习模型的学习方法，其特征在于，

11.根据权利要求1所述的以医疗数据为基础的深度学习模型的学习方法，其特征在于，

12.根据权利要求1所述的以医疗数据为基础的深度学习模型的学习方法，其特征在于，所述医疗数据包括心电图数据或电子健康记录数据中的至少一个。

13.一种以医疗数据为基础的深度学习模型的推论方法，由包括至少一个处理器的计算装置执行，其特征在于，包括下列步骤：

14.一种计算机程序，存储在计算机可读存储介质，其特征在于，

15.一种让以医疗数据为基础的深度学习模型学习的计算装置，其特征在于，

...

【技术特征摘要】
【国外来华专利技术】

1.一种以医疗数据为基础的深度学习模型的学习方法，由包括至少一个处理器的计算装置执行，其特征在于，包括下列步骤：

3.根据权利要求2所述的以医疗数据为基础的深度学习模型的学习方法，其特征在于，

5.根据权利要求4所述的以医疗数据为基础的深度学习模型的学习方法，其特征在于，所述变换函数包括：

6.根据权利要求4所述的以医疗数据为基础的深度学习模型的学习方法，其特征在于，所述第一副损失函数所含变换函数是把对应于所述第n-1个神经网络块的第一运算函数的输出的维度匹配到对应于所述第n个神经网络块的第二运算函数的输入的维度并且把对应于所述第n个神经网络块的第二运算函数的输出的维度匹配到对应于所述第n个神经网络块的第一运算函数的输出的维度的函数。

7.根据权利要求4所述的以医疗数据为基础的深度学习模型的学习方法，其特征在于，所述第二副损失函数所含变换函数是把对应...

【专利技术属性】
技术研发人员：权俊明，李炳卓，
申请(专利权)人：美迪科诶爱有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人