用于神经网络的预训练框架制造技术

技术编号：36178549 阅读：22 留言：0更新日期：2022-12-31 20:34

本公开涉及用于神经网络的预训练框架。用于指示文本与一个或更多个图像相对应的程度的装置、系统和技术。在至少一个实施例中，文本与一个或更多个图像相对应的程度使用一个或更多个神经网络来指示并且用于训练一个或更多个神经网络。多个神经网络。

全部详细技术资料下载

【技术实现步骤摘要】
用于神经网络的预训练框架

[0001]至少一个实施例涉及处理用于训练一个或更多个神经网络的资源。例如，至少一个实施例涉及根据所描述的各种新技术的用于至少通过使用一个或更多个神经网络以指示文本与一个或更多个图像相对应的程度来训练一个或更多个神经网络的处理器或计算资源。

技术介绍

[0002]在许多情况下，训练神经网络是一项重要任务。在各种情况下，训练神经网络需要包括图像和相关联的注释的训练数据。然而，这样的训练数据可能很难获得。因此可以改进用于训练神经网络的技术。
附图说明
[0003]图1示出了根据至少一个实施例的预训练框架的一个或更多个过程的示例；
[0004]图2示出了根据至少一个实施例的自注模块的示例；
[0005]图3示出了根据至少一个实施例的互相关模块的示例；
[0006]图4示出了根据至少一个实施例的多尺度图像编码和解码的示例；
[0007]图5示出了根据至少一个实施例的使用预训练框架的结果的示例；
[0008]图6示出了根据至少一个实施例的使用预训练框架的结果的另一示例；
[0009]图7示出了根据至少一个实施例的使用预训练框架的结果的另一个示例；
[0010]图8示出了根据至少一个实施例的使用预训练框架的结果的另一示例；
[0011]图9示出了根据至少一个实施例的使用预训练框架的结果的另一示例；
[0012]图10示出了根据至少一个实施例的预训练框架的过程的示例；
[0013]图11A示出了根据至少一个实施...

【技术保护点】

【技术特征摘要】
1.一种处理器，包括：一个或更多个电路，用于使用一个或更多个神经网络来指示文本与一个或更多个图像相对应的程度。2.根据权利要求1所述的处理器，其中所述一个或更多个电路进一步用于：计算所述文本和所述一个或更多个图像的特征；至少使用一个或更多个乘法和池化过程来处理所述特征；以及至少部分地基于所述处理的特征，使用所述一个或更多个神经网络来计算所述程度。3.根据权利要求2所述的处理器，其中所述一个或更多个电路用于至少使用所述程度来训练所述一个或更多个神经网络以执行一个或更多个分类任务。4.根据权利要求2所述的处理器，其中所述一个或更多个电路用于至少通过将所述处理的特征输入到一个或更多个sigmoid函数来计算所述程度。5.根据权利要求2所述的处理器，其中所述一个或更多个电路用于使用一个或更多个编码器来计算所述文本和所述一个或更多个图像的所述特征。6.根据权利要求1所述的处理器，其中所述文本和所述一个或更多个图像是未配对的数据。7.根据权利要求1所述的处理器，其中所述一个或更多个图像包括一个或更多个医学图像。8.一种系统，包括：一个或更多个计算机，其具有一个或更多个处理器，所述一个或更多个处理器用于使用一个或更多个神经网络来指示文本与一个或更多个图像相对应的程度。9.根据权利要求8所述的系统，其中所述一个或更多个处理器进一步用于：获得与所述文本相对应的第一组特征和与所述一个或更多个图像相对应的第二组特征；以及至少部分地基于一个或更多个sigmoid函数、所述第一组特征和所述第二组特征，使用所述一个或更多个神经网络来计算指示所述程度的第一值。10.根据权利要求9所述的系统，其中所述一个或更多个处理器进一步用于：至少部分地基于所述第一值，训练所述一个或更多个神经网络来执行一个或更多个相似性搜索任务。11.根据权利要求9所述的系统，其中所述一个或更多个处理器进一步用于：至少部分地基于所述一个或更多个图像，执行一个或更多个缩放操作来生成一组缩放图像；以及至少部分地基于所述一组缩放图像来计算所述第二组特征。12.根据权利要求9所述的系统，其中所述一个或更多个sigmoid函数包括逻辑函数。13.根据权利要求8所述的系统，其中所述文本和所述一个或更多个图像是配对的数据。14.根据权利要求8所述的系统，其中所述文本是医学文本。15.一种方法，包括：训练一个或更多个神经网络以指示文本与一个或更多个图像相对应的程度。16.根据权利要求15所述的方法，还包括：
获得包括地面实况值、所述文本和所述一个或更多个图像的训练数据；使所述一个或更多个神经网络计算指示所述文本与所述一个或更多个图像相对应的所述程度的值；以及至少部分地基于所述值和所述地面实况值之间的差异来更新所述一个或更多个神经网络。17.根据权利要求16所述的方法，还包括：至少部分地基于所述一个或更多个图像，使用所述一个或更多个神经网络来生成一个或更多个图像补丁；以及至少部分地基于所述一个或更多个图像补丁和所述一个或更多个图像来更新所述一个或更多个神经网络。18.根据权利要求17所述的方法，还包括至少部分地基于所述一个或更多个图像补丁和所述一个或更多个图像来训练所述一个或更多个神经网络，以用于一个或更多个图像再生任务。19.根据权...

【专利技术属性】
技术研发人员：王潚崧，徐子乐，L，
申请(专利权)人：辉达公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人