用于数据有效的主动机器学习的设备和计算机实现的方法技术

技术编号：29290832 阅读：20 留言：0更新日期：2021-07-17 00:25

用于主动机器学习的设备和计算机实现的方法，其中提供（206）带注释数据，其中根据所述带注释数据对模型（104）进行训练（208）以对所述数据进行分类，其中为未注释数据确定（210）所述未注释数据的采集函数的值，其中从所述未注释数据中为所述主动机器学习采集（212）其采集函数的值满足标准的非注释数据，其中为来自所述未注释数据、特别是来自所述模型（104）的至少一层的待评估模式确定关于特征表示的自相关，其中，根据关于所述自相关、特别是在至少一个维度上的均方根值确定该模式的采集函数的值。的值。的值。

全部详细技术资料下载

【技术实现步骤摘要】
用于数据有效的主动机器学习的设备和计算机实现的方法

[0001]本专利技术基于用于数据有效的主动机器学习的设备和计算机实现的方法。为此尤其使用深度神经网络。

技术介绍

[0002]深度神经网络为样本提供预测，并为这些预测的不确定性提供估计。对于特定的应用而言，由深度神经网络提供的预测不确定性的估计可能不足。尤其是对于位于训练集合之外的样本，相关的估计通常过于自信。
[0003]对于诸如自主驾驶或医疗应用的对安全至关重要的应用而言，可靠的不确定性是至关重要的。

技术实现思路

[0004]利用根据独立权利要求的计算机实现的方法和设备来确定可靠的不确定性。
[0005]用于主动机器学习的计算机实现的方法规定，提供带注释数据，其中根据所述带注释数据对模型进行训练以对所述数据进行分类，其中为未注释数据确定所述未注释数据的采集函数的值，并且其中从所述未注释数据中为所述主动机器学习采集以下非注释数据，所述非注释数据的采集函数的值满足标准，其中为来自所述未注释数据、特别是来自所述模型的至少一层的待评估模式确定关于特征表示的自相关，其中根据关于所述自相关、特别是在至少一个维度上的均方根值确定该模式的采集函数的值。对于至少部分训练的模型，根据所述均方根值很好地评估给定状况与所述训练集合的差异到底有多大。
[0006]优选地提供未注释数据的集合，其中从未注释数据的所述集合中选择子集合，其中通过特别是手动地、半自动地或自动地注释来自所述子集合的未注释数据来确定所述带注释数据。
[0007]优选...

【技术保护点】

【技术特征摘要】
1.一种用于主动机器学习的计算机实现的方法，其特征在于，提供（206）带注释数据，其中根据所述带注释数据对模型（104）进行训练（208）以对所述数据进行分类，其中为未注释数据确定（210）所述未注释数据的采集函数的值，其中从所述未注释数据中为所述主动机器学习采集（212）其采集函数的值满足标准的非注释数据，其中为来自所述未注释数据、特别是来自所述模型（104）的至少一层的待评估模式确定关于特征表示的自相关，其中根据关于所述自相关、特别是在至少一个维度上的均方根值确定该模式的采集函数的值。2.根据权利要求1所述的方法，其特征在于，提供（202）未注释数据的集合，其中从未注释数据的所述集合中选择（204）子集合，其中通过特别是手动地、半自动地或自动地注释来自所述子集合的未注释数据来确定（206）所述带注释数据。3.根据权利要求2所述的方法，其特征在于，所述子集合包括为所述主动机器学习采集的未注释数据。4.根据前述权利要求中任一项所述的方法，其特征在于，对于所述待评估模式，确定关于所述模型（104）的各个层的大量特征表示的自相关。5.根据前述权利要求中任一项所述的方法，其特征在于，从所述未注释数据中采集其均方根值超过阈值的那些模式。6.根据权利要求5所述的方法，其特征在于，根据来自用于对所述模型（104）进行训练的带注释数据的至少一个模式确定所述阈...

【专利技术属性】
技术研发人员：C，
申请(专利权)人：罗伯特，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人