使用随机森林分类从传感器数据估计条件的系统和方法技术方案

技术编号:21114054 阅读:21 留言:0更新日期:2019-05-16 08:23
本发明专利技术涉及使用随机森林分类从传感器数据估计条件的系统和方法。本发明专利技术的各种实施例允许提高监视设备的测量精度,例如,从加速度计测量的运动数据精确地确定速度。在某些实施例中,这通过将类似于随机森林分类的分类过程应用于记录的样本数据以检测与已知速度类型的数据相关联的特征的相似性,将样本数据分类为速度类型,并最终将速度类型平均以获得最终速度的高精度估计值。

System and Method for Estimating Conditions from Sensor Data Using Random Forest Classification

【技术实现步骤摘要】
使用随机森林分类从传感器数据估计条件的系统和方法
本公开涉及提高传感器系统中的测量精度。更具体地,本公开涉及用于提高诸如可穿戴设备中使用的加速度计之类的监视设备的测量精度的系统和方法。
技术介绍
精确测量运动(例如,速度和加速度)的能力是可穿戴设备的发展中的重要因素之一。对于在装置的佩戴者运动时(例如在体育锻炼期间)测量热量消耗的装置尤其如此。使用加速度计数据的经典集成来测量速度的现有方法遭受将这些方法实施到实践中的困难。这主要是由于高采样速率要求和固有的加速度计噪声导致积分常数漂移。其他方法具有其自身的缺点,并且依赖于GPS数据的方法具有有限的应用。将随机森林分类方法应用于加速数据以对运输模式进行分类(例如步行或使用自行车、汽车或火车)的一种方法完全不能解决准确的速度测量问题。因此,需要的是提高监测装置的测量精度的系统和方法,包括测量速度的装置。附图说明将参考本专利技术的实施例,其示例可以在附图中示出。这些图旨在说明而非限制。尽管通常在这些实施方案的上下文中描述了本专利技术,但应理解,并不意图将本专利技术的范围限制于这些具体实施方案。图1示出了根据本公开的各种实施例的传感器数据的示例性使用,以生成针对不同速度类型的记录。图2示出了根据本公开的各种实施例的用于在分类过程中使用的原始测量数据的特征的生成。图3是根据本公开的各种实施例的用于随机选择特征和记录的说明性过程的流程图。图4示出了根据本公开的各种实施例的包括特征值对之间的计算差异的矩阵。图5是根据本公开的各种实施例的用于确定速度类型的说明性分类过程的流程图。图6示出了使用通过图3的过程获得的特征值来对潜在速度进行选择的过程。图7示出了根据本公开的各种实施例的用于基于由随机森林中的决策单元做出的决策来估计速度的示例性分类过程的方法。图8是示出图6中的分类决策过程的特征集减少的机器学习过程的流程图。图9是根据本公开的各种实施例的示出决策单元替换和/或去除的机器学习过程的流程图。图10描绘了根据本专利技术的实施例的信息处理系统/计算系统的框图。具体实施方式在以下描述中,出于解释的目的,阐述了具体细节以便提供对本专利技术的理解。然而,对于本领域技术人员清楚的是,可以在没有这些细节的情况下实践本专利技术。此外,本领域技术人员将认识到,下面描述的本专利技术的实施例可以以各种方式实现,诸如有形计算机可读介质上的过程、装置、系统、设备或方法。图中所示的组件或模块是本专利技术的示例性实施例的说明,并且旨在避免模糊本专利技术。还应该理解,在整个讨论中,组件可以被描述为单独的功能单元,其可以包括子单元,但是本领域技术人员将认识到,各种组件或其部分可以被分成单独的组件或者可以集成在一起,包括集成在单个系统或组件中。应该注意,这里讨论的功能或操作可以实现为组件。组件可以用软件,硬件或其组合来实现。此外,附图中的组件或系统之间的连接不旨在限于直接连接。相反,可以通过中间组件修改,重新格式化或以其他方式改变这些组件之间的数据。此外,可以使用更多或更少的连接。还应注意,术语“耦合”、“连接”或“通信耦合”应理解为包括直接连接,通过一个或多个中间设备的间接连接,以及无线连接。说明书中对“一个实施例”、“优选实施例”、“实施例”或“实施例”的引用意味着至少包括结合该实施例描述的特定特征、结构、特性或功能。本专利技术的一个实施例可以是一个以上的实施例。此外,在说明书中各处出现的上述短语不一定都指的是相同的实施例。在说明书中的各个地方使用某些术语仅用于说明而不应被解释为限制。服务、功能或资源不限于单个服务、功能或资源;这些术语的使用可以指可以分发或聚合的相关服务、功能或资源的分组。此外,这里可以使用存储器、数据库、信息库、数据存储、表格、硬件等来指代可以输入或以其他方式记录信息的系统组件。此外,应注意:(1)可以可选地执行某些步骤;(2)步骤可以不限于此处所述的特定顺序;(3)某些步骤可以不同的顺序执行;(4)某些步骤可以同时进行。此外,应当注意,这里描述的实施例是在从运动数据估计速度的背景下给出的,但是本领域技术人员将认识到本公开的教导不限于估计速度或使用运动数据并且可以同样地应用于可以从提高传感器数据的准确性中受益的其他背景。在本文中,术语“速度”和“速度类型”可互换使用。图1示出了根据本公开的各种实施例的传感器数据的使用以生成针对不同速度类型的记录。图1所示的是运动传感器104、加速度计数据106和从加速度计数据106生成的记录110。如图所示,每个记录110可以包括与至少一个速度类型114相关联的特征112。参考图2进一步详细描述从原始加速度计数据106生成特征112。运动传感器104是能够生成运动相关信号的任何设备,可以从该运动相关信号导出运动相关数据。传感器104可以直接或间接(例如,通过智能电话)与远程网络通信。在实施例中,传感器104是加速度计,其测量加速度并输出原始或预处理的加速度计数据106,例如,通过测量一段时间内的加速度并从测量的加速度计数据106生成期望数量的记录110或数据集。在实施例中,例如,为了提高准确度,采样的加速计数据106可以包括个性化数据,使得提取的特征值是针对特定用户、性别、锻炼方式、年龄或其他期望类别而定制的,例如,在训练项目中,对特定用户配置文件或组进行采样以生成可用于代替默认特征值的特征值。在实施例中,运动传感器104对加速度计数据106采样特定时间段并且对于多种不同但已知的速度类型114采样。例如,传感器104可以以0.5mph、1mph、1.5mph等的速度采样加速度计数据106达3分钟的采样时间,直至例如10英里/小时的采样速度。在实施例中,采样周期可以被划分为较短时间段的加速度计数据106,可以向该较短时间段的加速度计数据106应用特征112以提取可以组装成数据记录110的特征值。在实施例中,在传感器104内部或外部的处理器(图1中未示出)应用与特征112相关联的数学运算,以从一些或所有加速度计数据106中提取特征值,以为每个已知的加速度计数据生成记录110。在实施例中,特征112是从更大的特征集中随机选择的特征的子集。例如,可以从包括28个特征的特征集中选择5个特征112的子集,例如,通过使用随机选择过程。应该理解,可以采用任何数量的特征、子特征和速度类型来实现本专利技术的目标。在实施例中,处理器将特征112应用于已经在3秒时间跨度期间测量的加速度计数据106,以提取每个速度类型114的特征值。出于说明的目的,仅在图1中示出与四个不同的速度类型114相关联的四个记录110。在实施例中,处理器可识别与记录110相关联的速度,并随机选择代表任何数量的已知速度类型114的各个速度类型114的记录110。在实施例中,记录110例如通过使用随机选择过程被划分为训练集(例如,80%的记录110)和用作验证数据集的测试集(例如,20%的记录110)。应当理解,在估计或做出关于最终速度的决策之前,可以在预备步骤中执行运动数据收集操作、特征选择和记录创建中的一些或全部。图2示出了根据本公开的各种实施例的用于在分类过程中使用的原始测量数据的特征的生成。图2描绘了原始数据202、原始数据202的数据处理208以及特征230的创建。在实施例中,数据处理208包括在特征230的生本文档来自技高网...

【技术保护点】
1.一种用于从传感器测量估计条件的系统,该系统包括:传感器,从所测量的参数生成传感器数据,传感器数据与多个特征相关联;和处理器,耦合到传感器以接收传感器数据,处理器生成执行以下步骤的第一决策单元:选择第一组记录,第一组记录中的每个记录包括具有相应特征值的第一组特征,每个记录与不同的条件相关联;计算与不同条件相关联的特征值对之间的特征值差异的组;至少部分地基于所测量的参数,确定包括未知条件的查询记录的样本特征值;从该特征值差异的组中,识别与第一特征值和第二特征值相关的最大值;确定样本特征值与第一特征值和第二特征值中的每个之间的两个差异中的较大者;从特征值差异的组中丢弃那些从与两个差异中较大者相关的条件的记录中获得的特征值差异;返回到识别最大值的步骤,直到单个条件保持不变;和响应于剩余的单个条件,输出单个条件作为第一估计条件。

【技术特征摘要】
2017.11.07 US 15/806,2751.一种用于从传感器测量估计条件的系统,该系统包括:传感器,从所测量的参数生成传感器数据,传感器数据与多个特征相关联;和处理器,耦合到传感器以接收传感器数据,处理器生成执行以下步骤的第一决策单元:选择第一组记录,第一组记录中的每个记录包括具有相应特征值的第一组特征,每个记录与不同的条件相关联;计算与不同条件相关联的特征值对之间的特征值差异的组;至少部分地基于所测量的参数,确定包括未知条件的查询记录的样本特征值;从该特征值差异的组中,识别与第一特征值和第二特征值相关的最大值;确定样本特征值与第一特征值和第二特征值中的每个之间的两个差异中的较大者;从特征值差异的组中丢弃那些从与两个差异中较大者相关的条件的记录中获得的特征值差异;返回到识别最大值的步骤,直到单个条件保持不变;和响应于剩余的单个条件,输出单个条件作为第一估计条件。2.根据权利要求1所述的系统,其中所述处理器包括第二决策单元,所述第二决策单元随机选择其中每个包括第二组特征的第二组记录,所述第二决策单元输出第二估计条件。3.根据权利要求1所述的系统,还组合多个决策单元的输出。4.根据权利要求1所述的系统,其中所述输出被量化以对应于非数字分类。5.根据权利要求4所述的系统,其中,所述处理器还计算至少所述第一估计条件和第二估计条件的概率,以估计最终条件。6.根据权利要求5所述的系统,其中所述处理器丢弃不常使用的特征组以减小所述特征组的大小,以提高估计所述最终条件的准确度和性能中的至少一个。7.根据权利要求1所述的系统,其中所述传感器数据包括为所述系统的特定用户定制的移动数据。8.根据权利要求7所述的系统,其中所述移动数据包括加速度计数据,并且所述第一估计条件是速度。9.一种使用第一决策单元从传感器测量估计条件的方法,该方法包括:接收与从中生成特征值的多个特征相关联的传感器数据;给定第一组记录,第一组记录中的每个记录与不同的条件相关联并且包括具有相应特征值的第一组特征,计算与不同条件相关联的特征值对之间的特征值差异的组;对于从传感器数据查询的并包含未知条件的记录,确定样本特征值;确定样本特征值与特征值对中的每个特征值之间的两个数值距离中的较大者;从特征值差异的组中丢弃那些从与两个数值距离中较大者相关的条件的记录中获得的特征值差异;和在特征值与剩余单个条件相关联时,输出单个条件作为第一估计条件。10.根据权利要求9所述的方法,其中随机选择所述特征组和所述...

【专利技术属性】
技术研发人员:K·L·王徐敬亚
申请(专利权)人:国际科技大学基金会
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1