生成针对经训练的模型的元数据制造技术

技术编号:27947651 阅读:47 留言:0更新日期:2021-04-02 14:31
本发明专利技术涉及在训练数据,例如训练的神经网络,上训练的经训练的模型。提供了系统和计算机实现的方法,用于生成对经训练的模型的训练数据的数值特性进行编码的元数据,以及使用所述元数据来确定所述经训练的模型的输入数据与所述训练数据的数值特性的一致性。如果输入数据不符合数值特性,则可以将经训练的模型用于输入数据认为不合规(“不合规”)。因此,将经训练的模型应用于输入数据的系统可以例如警告用户不合规,或者可以拒绝将经训练的模型应用于输入数据等。

【技术实现步骤摘要】
【国外来华专利技术】生成针对经训练的模型的元数据
本专利技术涉及用于处理经训练的模型的系统和计算机实现的方法,所述经训练的模型例如是训练的神经网络,所述经训练的模型是在训练数据上训练的。本专利技术还涉及用于将经训练的模型与输入数据一起使用的系统和计算机实现的方法,例如,用于对输入数据进行分类。本专利技术还涉及包括用于执行任一计算机实现的方法的指令的计算机可读介质。
技术介绍
机器学习在各个领域和出于各种目的正扮演着越来越重要的角色。例如,在医学领域,已经发现诸如深度学习的机器学习技术非常适合于对来自包括CT、X射线、数字病理学和MRI的各种模态对图像内容进行分类和分割。众所周知,这种机器学习可以使用训练数据作为输入来对模型(例如,神经网络)进行训练。在这样的训练之后,可以将经训练的模型应用于新的输入数据,例如,以从新数据获得预测或分类。在特定示例中,可以在标记的医学图像上对经训练的模型进行训练,并在以后的使用期间,将其应用于医学图像以获得医学图像中解剖结构的分类或分割。经训练的模型的各种其他使用是已知的。经训练的模型通常在特定数据集上进行优化和验证。例如,本文档来自技高网...

【技术保护点】
1.一种用于处理经训练的模型的系统(100),包括:/n数据接口(120),其用于访问:/n模型数据(050),其表示经训练的模型,以及/n训练数据(030),所述经训练的模型在所述训练数据上被训练;处理器子系统(140),其被配置为:/n通过以下操作来表征所述训练数据:/n将所述经训练的模型应用于所述训练数据以获得所述经训练的模型的中间输出,并且/n基于所述经训练的模型的所述中间输出来确定数值特性;/n将所述数值特性编码为元数据(060);并且/n将所述元数据与所述模型数据相关联,以使得实体能够将所述经训练的模型应用于输入数据,并且由此获得所述经训练的模型的进一步的中间输出,以基于所述进一步...

【技术特征摘要】
【国外来华专利技术】20180827 EP 18190931.81.一种用于处理经训练的模型的系统(100),包括:
数据接口(120),其用于访问:
模型数据(050),其表示经训练的模型,以及
训练数据(030),所述经训练的模型在所述训练数据上被训练;处理器子系统(140),其被配置为:
通过以下操作来表征所述训练数据:
将所述经训练的模型应用于所述训练数据以获得所述经训练的模型的中间输出,并且
基于所述经训练的模型的所述中间输出来确定数值特性;
将所述数值特性编码为元数据(060);并且
将所述元数据与所述模型数据相关联,以使得实体能够将所述经训练的模型应用于输入数据,并且由此获得所述经训练的模型的进一步的中间输出,以基于所述进一步的中间输出来确定所述输入数据是否符合所述经训练的模型的所述训练数据的所述数值特性。


2.根据权利要求1所述的系统(100),其中,所述经训练的模型是经训练的神经网络,并且其中,所述中间输出包括所述经训练的神经网络的隐藏单元的子集的激活值。


3.根据权利要求2所述的系统(100),其中,所述训练数据(030)包括多个训练数据对象,并且其中,所述处理器子系统(140)被配置为:
将所述经训练的模型应用于所述多个训练数据对象中的个体训练数据对象,以获得激活值的多个集合;并且
将所述数值特性确定为激活值的所述多个集合的概率分布。


4.根据权利要求3所述的系统(100),其中,所述处理器子系统(140)被配置为:
获得不合规数据,所述不合规数据包括与所述多个训练数据对象的特性不同并且具有不符合所述多个训练数据对象的特性的特性的多个不合规数据对象;
将所述经训练的神经网络应用于所述多个不合规数据对象中的个体不合规数据对象,以获得激活值的另一多个集合;并且
选择隐藏单元的子集以建立a)激活值的所述多个集合的概率分布与b)激活值的所述另一多个集合的概率分布之间的差异,或增加或最大化所述差异。


5.根据权利要求4所述的系统(100),其中,所述处理器子系统(140)被配置为通过组合优化方法来选择隐藏单元的所述子集,所述组合优化方法将a)激活值的所述多个集合的概率分布与b)激活值的所述另一多个集合的概率分布之间的所述差异优化为取决于所选择的隐藏单元。


6.根据权利要求5所述的系统(100),其中,所述处理器子系统(140)被配置为将所述差异表达为以下组中的至少一项或者基于以下组中的至少一项来表达所述差异:
Kullback-Leibler散度量度,
交叉熵量度,以及
互信息量度。


7.根据权利要求4至6中的任一项所述的系统(100),其中,所述处理器子系统(140)被配置为:
使用生成式对抗网络的生成器部分来基于所述训练数据生成阴性样本;
根据所述阴性样本来生成所述不合规数据。


8.根据权利要求1至7中的任一项所述的系统(100),其中,所述处理器子系统(140)被配置为通过使用所述训练数据(030)对模型进行训练的来生成所述模型数据(050),由此获得所述经训练的模型。


9.根据权利要求1至8中的任一项所述的系统(100),其中,所述训练数据(030)包括多幅图像,并且其中,所述经训练的模型被配置用于图像分类或图像分割。


10.一种处理经训练的模型的计算...

【专利技术属性】
技术研发人员:B·J·巴克D·马夫罗伊迪斯S·特拉亚诺夫斯基
申请(专利权)人:皇家飞利浦有限公司
类型:发明
国别省市:荷兰;NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1