【技术实现步骤摘要】
相关申请的交叉引用本申请涉及名称为“用于训练数据的权重效益评价器”的美国专利申请序列号14/451,859、名称为“机器学习中的权重的生成”的美国专利申请序列号14/451,870、名称为“机器学习中的权重生成”的美国专利申请序列号14/451,899以及名称为“机器学习中的替代训练分布数据”的美国专利申请序列号14/451,935。
技术介绍
除非在本文中另外表明,否则本部分中所述的材料对于本申请中的权利要求不是现有技术,并且由于包括在本部分中而不被承认是现有技术。在机器学习环境中,包括训练输入和训练标签的训练数据可以被用来确定学习函数。学习函数可以是有效的,以指示训练输入与训练标签之间的关系。可以在机器学习系统中开发学习函数。机器学习系统可以接收测试输入,并且可以将学习函数应用到测试输入以产生测试标签。概述在一些示例中,一般地描述了机器学习环境中的方法。所述方法可以包括接收训练数据,其中,所述训练数据包括训练输入和训练标签。所述方法还可以包括接收测试数据,其中,所述测试数据可以对应于点的集合。所述方法还可以包括基于所述训练数据和测试数据,确定样本外误差的集合。所述方 ...
【技术保护点】
一种机器学习环境中的方法,所述方法包括:接收训练数据,其中,所述训练数据包括训练输入和训练标签;接收测试数据,其中,所述测试数据对应于点的集合;基于所述训练数据和所述测试数据,确定样本外误差的集合;基于所述样本外误差的集合,确定梯度值的集合,其中,所述梯度值的集合对应于所述测试数据中的所述点的集合,每个相应的梯度值对应于所述测试数据中的特定点,并且涉及第一量值和第二量值,其中,所述第一量值是与对应于所述点的集合的所述样本外误差的集合相关联的第一期望值,所述第二量值是与所述训练数据的一部分的样本外误差相关联并且与所述特定点相关联的第二期望值,其中,所述一部分不包括所述特定点; ...
【技术特征摘要】
2015.07.07 US 14/793,3281.一种机器学习环境中的方法,所述方法包括:接收训练数据,其中,所述训练数据包括训练输入和训练标签;接收测试数据,其中,所述测试数据对应于点的集合;基于所述训练数据和所述测试数据,确定样本外误差的集合;基于所述样本外误差的集合,确定梯度值的集合,其中,所述梯度值的集合对应于所述测试数据中的所述点的集合,每个相应的梯度值对应于所述测试数据中的特定点,并且涉及第一量值和第二量值,其中,所述第一量值是与对应于所述点的集合的所述样本外误差的集合相关联的第一期望值,所述第二量值是与所述训练数据的一部分的样本外误差相关联并且与所述特定点相关联的第二期望值,其中,所述一部分不包括所述特定点;将所述梯度值的集合变换成修改后的密度数据;以及基于所述修改后的密度数据,生成替代训练数据。2.根据权利要求1所述的方法,其中,确定所述样本外误差的集合包括:基于所述训练数据,确定函数;基于所述函数,生成与所述测试数据相对应的测试标签的集合;并且将所述测试标签的集合与所述训练数据的训练标签进行比较,以确定所述样本外误差的集合。3.根据权利要求2所述的方法,其中,所述函数是第一函数,并且所述方法还包括:接收所述替代训练数据;并且基于所述替代训练数据,确定第二函数,其中,所述第二函数与所述第一函数不同。4.根据权利要求1所述的方法,其中,确定所述梯度值包括:确定所述第一量值;确定所述第二量值;确定所述第一量值与所述第二量值之间的差;并且基于所述差,确定所述梯度值的集合。5.根据权利要求1所述的方法,其中,将所述梯度值的集合和所述测试数据变换成所述修改后的密度数据包括应用梯度下降更新技术。6.根据权利要求1所述的方法,其中,将所述梯度值的集合变换成所述修改后的密度数据包括:确定与所述特定点相对应的特定梯度值小于零;并且响应于与所述特定点相对应的所述特定梯度值小于零的确定,增大所述特定点的密度。7.根据权利要求1所述的方法,其中,将所述梯度值的集合变换成所述修改后的密度数据包括:确定与所述特定点相对应的特定梯度值大于零;并且响应于与所述特定点相对应的所述特定梯度值大于零的确定,减小所述特定点的密度。8.根据权利要求1所述的方法,其中,将所述梯度值的集合变换成所述修改后的密度数据包括:确定与所述特定点相对应的特定梯度值小于零;并且响应于与所述特定点相对应的所述特定梯度值小于零的确定,将所述特定点的密度设置为零。9.根据权利要求1所述的方法,其中,所述替代训练数据与所述训练数据不同,并且所述替代训练数据与所述测试数据不同。10.根据权利要求1所述的方法,其中,确定所述梯度值的集合包括:基于所述训练数据的密度,确定第一权重集合;转换所述第一权重集合,以产生转换后的权重;基于所述转换后的权重,确定第二权重集合;基于所述第一权重集合,确定所述第一量值;基于所述第二权重集合,确定所述第二量值;确定所述第一量值与所述第二量值之间的差;并且基于所述差,确定所述梯度值的集合。11.根据权利要求1所述的方法,其中,所述特定点是所述训练数据当中的固定点。12.一种机器学习环境系统,所述系统包括:存储器,被配置为:存储包括训练输入和训练标签的训练数据;并且存储对应于点的集合的测试数据;评价模块,被配置为与所述存储器通信,所述评价模块被配置为:接收所述训练数据;接收所述测试数据;并且基于所述训练数据,确定样本外误差的集合;密度修改模块,被配置为与所述存储器和所述评价模块通信,所述密度修改模块被配置为:接收所述样本外误差的集合;基于所述样本外误差的集合...
【专利技术属性】
技术研发人员:Y·S·阿布穆斯塔法,C·R·冈萨雷斯,
申请(专利权)人:加州理工学院,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。