【技术实现步骤摘要】
基于多维时间序列数据进行预测或训练模型的方法和系统
[0001]本说明书的一个或多个实施例涉及机器学习,尤其涉及用于针对基于多维时间序列数据进行预测或训练模型的方法、系统、装置和计算机可读存储介质。
技术介绍
[0002]目前,机器学习已被应用于时间序列数据,以便对时间序列数据进行建模,并利用所建立的模型来执行预测或处理(例如异常识别或风险识别等)。
[0003]例如,在在线交易等场景中,通常例如可利用与用户相关联的时间序列数据(例如登录历史、交易历史等)进行建模,从而可识别出异常交易(例如非法交易)或者异常用户(例如执行非法交易的用户)。
[0004]然而,在使用例如在线交易等场景中的时间序列数据等进行建模时可能存在问题。例如,一方面,大部分机器学习模型只能处理单维时间序列数据,而在处理多维时间序列数据时存在困难。另一方面,对于多维时间序列数据,现有方案通常采用基于规则的模型(有时被称为基线模型)。这样的基于规则的模型在不同区间的打分量指标往往有很强的相关性,因此存在准确率不高的问题。
[0005] ...
【技术保护点】
【技术特征摘要】
1.一种基于多维时间序列数据进行预测的方法,包括:监测多维时间序列数据流以获取当前观察点,所述当前观察点包括多维特征数据xt;基于所述当前观察点,应用经训练的神经过程模型进行预测,所述神经过程模型是使用多个先前观察点(xi,yi)训练的,每个先前观察点包括多维特征数据xi和相应的标签数据yi,其中所述神经过程模型包括编码器和解码器,所述编码器包括互关注模块,所述互关注模块基于所述当前观察点的多维特征数据xt与一个或多个先前观察点的多维特征数据xi之间的关联向所述多个先前观察点分配权重,以用于最终生成所述当前观察点的目标预测y*。2.如权利要求1所述的方法,其中所述编码器包括确定性通路和隐通路,其中所述确定性通路包括确定性编码器,所述确定性编码器用于基于多个先前观察点(xi,yi)来生成多个经编码表示ri,所述互关注模块基于所述当前观察点的多维特征数据xt、所述一个或多个先前观察点的多维特征数据xi、以及所述多个经编码表示生成特定于所述当前观察点的单个聚合表示r*。3.如权利要求2所述的方法,其中所述确定性编码器使用自关注模型。4.如权利要求2所述的方法,其中所述隐通路基于所述多个先前观察点(xi,yi)来生成隐变量z,所述解码器基于所述当前观察点的多维特征数据xt、特定于所述当前观察点的表示r*和所述隐变量z来生成所述当前观察点的目标预测y*。5.如权利要求1所述的方法,其中所述多维时间数据流为用户的在线活动数据流,且其中所述方法包括:基于所述目标预测y*检测所述用户的在线活动的异常。6.如权利要求5所述的方法,其中所述方法进一步包括:获取离线数据,其中检测所述用户的在线活动的异常进一步基于所述离线数据。7.如权利要求5所述的方法,其中所述方法进一步包括:提供单维时间序列异常检测模块,以及使用所述单维时间序列异常检测模块与所述神经过程模型一起检测所述用户的在线活动的异常。8.如权利要求5所述的方法,其中所述方法进一步包括:在检测到异常之后,使用归因模块自动确定所述异常所产生的原因。9.如权利要求5所述的方法,其中所述方法进一步包括:在检测到异常之后,使用告警模块输出告警信息。10.一种基于多维时间序列数据训练模型的方法,包括:获取多维度时间序列数据;基于所述多维度时间序列数据生成多个先前观察点(xi,yi),每个观察点与一时间指示相对应并且包括多维特征数据xi和相应的标签数据yi;使用所述多个先前观察点(xi,yi)的子集作为训练数据训练神经过程模型,其中所述神经过程模型包括编码器和解码器,所述编码器包括互关注模块,所述互关注模块被配置成:针对每个观察点基于该观察点的多维特征数据xi与的所述子集中的其它观察点的多维特征数据xi之间的关联向所述多个先前观察点分配权重,以用于最终生成该观察点的目标
预测yip,其中所述目标预测yip被用于与该观察点的标签数据yi生成损失值,基于所述损失值迭代调整所述神经过程模型以生成经训练的模型。11.如权利要求10所述的方法,其中所述编码器包括确...
【专利技术属性】
技术研发人员:倪翔,孟昌华,王维强,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。