自适应增强的机器学习制造技术

技术编号:19247318 阅读:26 留言:0更新日期:2018-10-24 09:04
一种装置包括存储器和至少一个处理核,存储器被配置为存储要被机器识别的数据(710),至少一个处理核被配置为使用该数据运行自适应增强机器学习算法,其中多个学习算法被应用,其中特征空间被划分为区间,其中失真函数被应用于特征空间的特征(720),并且其中失真函数的一阶导数不是常数(730)。

【技术实现步骤摘要】
【国外来华专利技术】自适应增强的机器学习
本专利技术涉及自适应增强的“AdaBoost”类型的机器学习算法。
技术介绍
机器学习和机器识别发现了若干应用,例如机场的自动护照控制,其中人脸的数字图像可以与存储在护照中的表征人脸的生物信息进行比较。机器识别的另一个示例是手写或打印的文档文本识别,以例如呈现可搜索的书籍内容。另一个示例是行人识别,其中最终自动驾驶汽车由此能够意识到行人在前方并且汽车可以避免撞到行人。除了视觉识别之外,口语可以是机器识别的主题。当口语被识别出时,可以随后将其输入到解析器以向数字个人助理提供命令,或者可以将其提供给机器翻译程序,从而获得与口语相对应的另一种语言的文本。机器识别技术采用为此目的而设计的算法。例如,神经网络可以被用于实现机器视觉应用。众所周知的机器视觉算法是Viola-Jones对象检测框架。机器识别算法可以包括处理功能,在识别图像时,这样的处理功能可以包括例如过滤(诸如形态过滤)、阈值处理、边缘检测、模式识别和对象尺寸测量。自适应增强或AdaBoost是一种通用框架,其中几种类型的学习算法被一起使用,以改善整个AdaBoost算法的性能。在将它们用作AdaBoost的子算法的上下文中,这种学习算法可以被称为弱分类器。
技术实现思路
本专利技术由独立权利要求的特征限定。一些具体实施例在从属权利要求中被限定。根据本专利技术的第一方面,提供了一种装置,包括:存储器,被配置为存储要被机器识别的数据;至少一个处理核,被配置为使用该数据运行自适应增强机器学习算法,其中多个学习算法被应用,其中特征空间被划分为区间,其中失真函数被应用于特征空间的特征,并且其中失真函数的一阶导数不是常数。第一方面的各种实施例包括来自以下项目符号列表中的至少一个特征:·每个学习算法在不同的区间上操作·至少一个处理核被配置为将特征空间进行划分,使得区间的至少一个子集的大小均匀·至少一个处理核被配置为将特征空间进行划分,使得所有区间的大小均匀·至少一个处理核被配置为将特征空间进行划分,使得任何两个区间之间没有重叠·至少一个处理核被配置为在将失真函数应用于特征之后将特征空间划分为区间·在自适应增强机器学习算法中,每个区间被独立地处理·至少一个处理核被配置为将特征空间划分为256个区间·至少一个处理核被配置为在自适应增强机器学习算法中确定学习算法之一作为每次迭代中的最优分类器·至少一个处理核被配置为在自适应增强机器学习算法中确定最终输出作为多个学习算法中的每个学习算法的输出的加权和·失真函数的类型为·自适应增强机器学习算法包括训练阶段·该装置被配置为将自适应增强机器学习算法应用于以下中的至少一个的识别:口语对话、人脸、行人、文本和文档根据本专利技术的第二方面,提供了一种方法,包括存储要被机器识别的数据,使用该数据运行自适应增强机器学习算法,其中多个学习算法被应用,其中特征空间被划分为区间,其中失真函数被应用于特征空间的特征,并且其中失真函数的一阶导数不是常数。第一方面的各种实施例包括来自以下项目符号列表中的至少一个特征:·每个学习算法在不同的区间上操作·特征空间被划分,使得区间的至少一个子集的大小均匀·特征空间被划分,使得所有区间的大小均匀·特征空间被划分,使得任何两个区间之间没有重叠·在将失真函数应用于特征之后,发生将特征空间划分为区间·自适应增强机器学习算法,每个区间被独立地处理·特征空间被划分为256个区间·在自适应增强机器学习算法中,确定学习算法之一作为每次迭代中的最优分类器·在自适应增强机器学习算法中,确定最终输出作为多个学习算法中的每一个的输出的加权和·失真函数的类型是·自适应增强机器学习算法包括训练阶段·将自适应增强机器学习算法应用于以下中的至少一个的识别:口语对话、人脸、行人、文本和文档根据本专利技术的第三方面,提供了一种装置,包括用于存储要被机器识别的数据的部件,以及用于使用该数据运行自适应增强机器学习算法的部件,其中多个学习算法被应用,其中特征空间被划分为区间,其中失真函数被应用于特征空间的特征,并且其中失真函数的一阶导数不是常数。根据本专利技术的第四方面,提供了一种非瞬态计算机可读介质,其上存储有计算机可读指令的集合,当由至少一个处理器执行时,计算机可读指令使得装置至少:存储要被机器识别的数据,以及使用数据运行自适应增强机器学习算法,其中多个学习算法被应用,其中特征空间被划分为区间,其中失真函数被应用于特征空间的特征,并且其中失真函数的一阶导数不是常数。根据本专利技术的第五方面,提供了一种计算机程序,其被配置为使得根据第二方面的方法被执行。附图说明图1示出了能够支持本专利技术的至少一些实施例的示例系统;图2示出了被划分的特征空间中的分类器响应;图3示出了能够支持本专利技术的至少一些实施例的示例装置;图4示出了示例失真函数;图5示出了使用失真函数的特征空间的失真;图6示出了传统的AdaBoost方法和隐式非均匀划分的AdaBoost方法之间的差异,以及图7是根据本专利技术的至少一些实施例的方法的流程图。具体实施方式在AdaBoost算法中,特征空间可以被划分为均匀大小的区间或非均匀的区间。虽然均匀划分成相同大小的区间并不总是最优的,但是使用不均匀的划分,其中区间具有不同的大小,涉及更复杂的处理。当使用均匀划分时,失真函数可以被应用于特征,以获得比在非均匀划分的情况下更加简单的处理,但是具有非均匀划分的至少一些益处。例如,失真函数可以包括拉伸函数。在本专利技术的一些实施例中,使用失真函数导致均匀划分处理,其结果与使用非均匀划分等同。在术语上,使用失真函数可以被称为隐式非均匀划分。图1示出了能够支持本专利技术的至少一些实施例的示例系统。图1具有道路101的视图110,行人120在道路101上行走。尽管在这里结合图1在检测行人方面进行了描述,但是本专利技术不限于此,但是如本领域技术人员将理解的,本专利技术还更一般地适用于视觉、音频或其他类型的数据中的机器识别。例如,取决于所讨论的实施例,自行车识别、手写识别、面部识别、交通标志识别、语音识别、语言识别、手语识别和/或垃圾邮件识别可以从本专利技术中受益。在图1中,道路101由相机130成像。相机130被配置为至少部分地捕获覆盖道路的视图110。相机130可以被配置为预处理从包括在相机130中的图像捕获设备(诸如电荷耦合设备CCD)获得的图像数据。预处理的示例包括减少到黑白、对比度调整和亮度平衡以增加捕获图像中存在的动态范围。在一些实施例中,图像数据也被缩放到适合于馈送到图像识别算法(诸如AdaBoost)的比特深度。预处理可以包括对感兴趣的区域的选择,诸如区域125,例如,用于馈送到图像识别算法中。预处理可以本质上不存在或受限制。相机130可以安装在例如被配置为自己驾驶的汽车中。可替换地,相机130可以被安装在设计成由人类驾驶员驾驶的汽车中,但是如果汽车看起来即将撞到行人或动物,则提供警告和/或自动刹车。来自相机130的图像馈送可以被提供给图像识别算法140。物理上,图像识别算法140可以与相机130在相同的设备中操作,或者,它可以驻留在另一个设备中。在一些实施例中,图像识别算法140被布置在不同的计算节点中,该计算节点可以包括云计算节点、服务器或其他合适的设备。例如,相机130可以输出图像馈送,其可以包括图像帧。图本文档来自技高网...

【技术保护点】
1.一种装置,包括:‑存储器,被配置为存储要被机器识别的数据;‑至少一个处理核,被配置为使用所述数据运行自适应增强机器学习算法,其中多个学习算法被应用,其中特征空间被划分为区间,其中失真函数被应用于所述特征空间的特征,并且‑其中所述失真函数的一阶导数不是常数。

【技术特征摘要】
【国外来华专利技术】1.一种装置,包括:-存储器,被配置为存储要被机器识别的数据;-至少一个处理核,被配置为使用所述数据运行自适应增强机器学习算法,其中多个学习算法被应用,其中特征空间被划分为区间,其中失真函数被应用于所述特征空间的特征,并且-其中所述失真函数的一阶导数不是常数。2.根据权利要求1所述的装置,其中所述学习算法中的每个学习算法在不同的区间上操作。3.根据权利要求1或2所述的装置,其中所述至少一个处理核被配置为对所述特征空间进行划分,使得所述区间的至少一个子集的大小均匀。4.根据权利要求1-3中任一项所述的装置,其中所述至少一个处理核被配置为对所述特征空间进行划分,使得所有所述区间的大小均匀。5.根据权利要求1-4中任一项所述的装置,其中所述至少一个处理核被配置为对所述特征空间进行划分,使得所述区间中的任何两个区间之间没有重叠。6.根据权利要求1-5中任一项所述的装置,其中所述至少一个处理核被配置为在将所述失真函数应用于所述特征之后将所述特征空间划分为所述区间。7.根据权利要求1-6中任一项所述的装置,其中在所述自适应增强机器学习算法中,每个区间被独立地处理。8.根据权利要求1-7中任一项所述的装置,其中所述至少一个处理核被配置为将所述特征空间划分为256个区间。9.根据权利要求1-8中任一项所述的装置,其中所述至少一个处理核被配置为在所述自适应增强机器学习算法中,确定所述学习算法之一作为每次迭代中的最优分类器。10.根据权利要求1-9中任一项所述的装置,其中所述至少一个处理核被配置为在所述自适应增强机器学习算法中,确定最终输出作为所述多个学习算法中的每个学习算法的输出的加权和。11.根据权利要求1-10中任一项所述的装置,其中所述失真函数的类型为12.根据权利要求1-11中任一项所述的装置,其中所述自适应增强机器学习算法包括训练阶段。13.根据权利要求1-12中任一项所述的装置,其中所述装置被配置为将所述自适应增强机器学习算法应用于以下中的至少一项的识别:口语对话、人脸、行人、文本和文档。14.一种方法,包括:-存储要被机器识别的数据;-使用所述数据运行自适应增强机器学习算法,其中多个学习算法被应用,其中特征空间被划分为区间,其中失真函数被应用于所述特征空间的特征,并且-其中所述失真函数的一阶导数不是常数。15.根据...

【专利技术属性】
技术研发人员:尚楚博
申请(专利权)人:诺基亚技术有限公司
类型:发明
国别省市:芬兰,FI

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1