用于对时间序列数据进行分类的方法和系统技术方案

技术编号:24949815 阅读:48 留言:0更新日期:2020-07-18 00:02
一种识别方法,包括检索包括第一窗口大小的数据在内的输入。该方法还包括基于输入的变形距离与修剪阈值的比较来对输入进行分类。

【技术实现步骤摘要】
【国外来华专利技术】用于对时间序列数据进行分类的方法和系统
一个或多个实施例通常涉及时间序列数据分类,更具体地,涉及对具有不同速度的时间序列数据的实时分类。
技术介绍
时间序列数据在各种现代设备中无处不在。许多移动设备(例如智能手机、虚拟现实耳机、智能手表、可穿戴设备等)都配备了运动传感器,例如,加速度传感器、陀螺仪传感器、地磁传感器等。这些传感器通常指示用户在每个时间点的运动和行为。诸如洗衣机、干衣机等数字设备也生成许多时间序列数据,例如时间序列数据运动传感器、能耗等。该数据会随着时间监测设备状态。现有设备(例如,智能手机和智能手表上的心率(HR)传感器)和潜在的未来设备(心电图(ECG)传感器、皮肤电反应(GSR)传感器等)中包括各种与健康相关的传感器。这些传感器的流数据可用于指示用户的健康或活动状态。未来的虚拟现实(VR)设备可以直接配备脑电图(EEG)传感器,以实现用户与设备之间的脑机交互。
技术实现思路
技术问题本公开的一方面在于提供用于对时间序列数据进行分类的方法和装置。问题的解决方案在实施例中,识别方法包括检索包括第一窗口大小的数据在内的输入。该方法还包括基于输入的变形距离与修剪阈值的比较来对输入进行分类。在一些实施例中,电子设备包括存储指令的存储器。至少一个处理器执行包括过程的指令,该至少一个处理器被配置为:检索包括第一窗口大小的数据在内的输入;以及基于输入的变形距离与修剪阈值的比较对输入进行分类。在一个或多个实施例中,一种非暂时性处理器可读介质,其包括程序,该程序在由处理器执行时执行方法,该方法包括:检索包括第一窗口大小的数据在内的输入。该方法还包括基于输入的变形距离与修剪阈值的比较来对输入进行分类。通过结合附图以示例的方式示出了一个或多个实施例的原理的以下详细描述,该一个或多个实施例的这些和其他方面以及优点将变得显而易见。本专利技术的有益效果根据本公开的各种实施例,可以实现用于快速数据修剪的有效下界计算。根据本公开的各种实施例,可以大幅度减少昂贵的变形距离计算的数量。附图说明为了更全面地理解实施例的性质和优点以及优选的使用方式,应参考结合附图阅读的以下详细描述,在附图中:图1示出了根据一些实施例的通信系统的示意图;图2示出了根据一些实施例的包括电子设备和云或服务器环境在内的系统的架构的框图,该系统能够单独或组合地执行基于时间序列数据分类的数据处理;图3示出了根据一些实施例的用于时间序列数据的实时数据分类的系统的流程图;图4示出了根据一些实施例的用于数据分类模型训练和修剪阈值学习的框图;图5示出了根据一些实施例的用于使用训练实例和查询实例的基于包络的下界确定的示例曲线图;图6示出了根据一些实施例的用于时间序列数据分类的训练阶段的运行示例;图7示出了根据一些实施例的用于时间序列数据的实时数据分类(测试)阶段的运行示例;图8示出了根据一些实施例的用于时间序列数据分类的过程的框图;以及图9是示出了包括实现一个或多个实施例的计算系统的信息处理系统的高级框图。具体实施方式出于说明一个或多个实施例的一般原理的目的而进行以下描述,但并不意味着限制本文要求保护的专利技术构思。此外,可以以各种可能的组合和排列中的每个组合和排列将本文描述的特定特征与其他描述的特征组合使用。除非本文另外明确定义,否则将给予所有术语其最宽泛的可能解释,包括说明书中暗示的含义以及本领域技术人员理解和/或字典、论文等中定义的含义。应当注意的是,术语“至少一个”是指所列元素中的一个或多个。例如,“a、b、c中的至少一个或其组合”可以分别解释为“a”、“b”或“c”;或“a”和“b”组合在一起,或“b”和“c”组合在一起;“a”和“c”组合在一起;或“a”、“b”和“c”组合在一起。本专利文档的公开的一部分可以包含受到版权保护的材料。版权所有人不反对任何人对专利文档或专利公开(如其在专利和商标局中的专利文件或记录中出现的原样)进行复制再现,但是在其他情况下版权所有人保留所有版权。一个或多个实施例提供对以不同速度发生的时间序列数据进行的实时分类。一些实施例包括方法,该方法包括检索包括第一窗口大小的数据在内的输入。该方法还包括基于输入的变形距离与修剪阈值的比较来对输入进行分类。对时间序列数据的分析已成为在电子设备(例如,智能手机、智能设备、可穿戴设备等)上启用智能服务的商业驱动力。运动传感器的分析有助于识别用户的动作或行为,从而使设备可以启用与用户的交互或向用户提供个人帮助。例如,当设备识别出用户在握住虚拟现实(VR)控制器的情况下执行手势时,电子设备可以相应地控制VR系统。根据健康传感器,电子设备可以提供随着时间对用户健康状态的连续监测,例如心脏病患者的心脏状态。这种连续和实时的监测不仅可以使用户受益,而且可以显著减少医生的工作量。EEG信号的分析可以帮助电子设备直接理解来自用户的大脑命令,该大脑命令可以用于直接控制电子设备。然而,时间序列数据以不同的速度生成。即使对于一个动作,用户通常以或多或少的不同速度移动,这导致来自例如运动传感器的时间序列数据的长度不同。此外,每个类/动作的两个实例在整个时间序列数据的某些部分可能具有不同的速度,称为“变形”。例如,当用户在VR游戏中执行射击手势时,举手的子动作和射击的另一子动作可以具有不同的速度。同样,这样的速度差异也存在于生物传感器(例如EEG、ECG等)中。大多数时间序列数据还可以是多维数据。每个运动传感器通常由不同的轴构成,并且可以将不同运动传感器的融合一起用于检测用户的每个动作。因此,维度数量可以达到10个以上。健康传感器和EEG传感器两者通常使用多个电极被收集,其中每个电极收集一个数据通道。例如,EEG信号可由超过256个通道组成。在一些实施例中,下面描述了不会根据这种速度差异而改变的鲁棒分类过程。结果,可以对关于每个动作/类别的时间序列数据的不同实例(即使它们的速度非常不同)进行正确分类。在一些实施例中,实时过程对时间序列数据进行分类,以启用用户的个人设备上的智能,例如VR或智能电视上的手势控制、基于EEG的大脑控制、健康监测等。用于对时间序列数据进行分类的实时过程旨在分析具有不同速度的实时时间序列流数据。在训练阶段期间,实时过程通过用户指定的类别(例如,预定义手势)获取带标签的时间序列训练集,以训练对每个训练样本的不同速度都鲁棒的模型。训练阶段还推导出修剪阈值。在测试/分类阶段期间,实时过程为快速数据修剪设计了有效的下届计算,从而提供了实时分类结果。使用实时过程,可以大大减少昂贵的变形距离计算的数量。实时过程被设计为通用框架,其可以对各种类型的时间序列数据和各种速度差异进行实时分类。在一些实施例中,系统(例如,图2的系统100)被设计为通过将修剪方案应用到实时流数据上来实时处理大量时间序列数据。该系统包括低计算修剪方案和分类模型,用于支持电子设备(例如,图2的电子设备120)的低功本文档来自技高网...

【技术保护点】
1.一种识别方法,包括:/n检索包括第一窗口大小上的数据在内的输入;以及/n基于所述输入的变形距离与修剪阈值的比较对所述输入进行分类。/n

【技术特征摘要】
【国外来华专利技术】20171229 US 62/612,203;20181227 US 16/234,4331.一种识别方法,包括:
检索包括第一窗口大小上的数据在内的输入;以及
基于所述输入的变形距离与修剪阈值的比较对所述输入进行分类。


2.根据权利要求1所述的识别方法,还包括:
基于经训练的模型将可识别输入分类为已知输入类型;
其中:
所述已知输入类型包括第二窗口大小上的数据;以及
所述第一窗口大小不同于所述第二窗口大小。


3.一种包括程序的非暂时性处理器可读介质,所述程序在由处理器执行时,执行包括以下操作的方法:
检索包括第一窗口大小的数据在内的输入;以及
基于所述输入的变形距离与修剪阈值的比较对所述输入进行分类。


4.根据权利要求3所述的非暂时性处理器可读介质,其中,所述方法还包括:
基于经训练的模型将可识别输入分类为已知输入类型,其中:
所述已知输入类型包括第二窗口大小的一序列数据;以及
所述第一窗口大小不同于所述第二窗口大小。


5.根据权利要求4所述的非暂时性处理器可读介质,其中:
对所述可识别输入进行分类包括:为时间序列数据的实例应用标签。


6.根据权利要求2所述的识别方法,或者根据权利要求4所述的非暂时性处理器可读介质,其中,对可识别输入进行分类包括:通过使用变形距离确定所有带标签的时间序列数据的实例的成对距离,来预处理所述所有带标签的时间序列数据的实例,以考虑每个带标签的时间序列实例的不同速度,并且基于训练数据学习所述修剪阈值。


7.一种电子设备,包括:
存储器,存储指令;以及
至少一个处理器,执行包括过程的所述指令,所述至少一个处理器被配置为:
检索包括第一窗口大小上的数据在内的输入;以及
基于所述输入的变形距离与修剪阈值的比较对所述输入进行分类。


8.根据权利要求7所述的电子设备,其中,所述至少一个处理器还被配置为...

【专利技术属性】
技术研发人员:沈逸麟邓岳金红霞
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:韩国;KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1