利用机器学习模型进行线上预测的辅助实现方法及装置制造方法及图纸

技术编号:25598902 阅读:43 留言:0更新日期:2020-09-11 23:56
公开了一种利用机器学习模型进行线上预测的辅助实现方法及装置。设置线上数据存储系统和线下数据存储系统,其中,线上数据存储系统用于存储在线环境中进行特征计算所使用的至少部分数据,线下数据存储系统用于存储离线环境中进行特征计算所使用的至少部分数据;将数据分别存入线上数据存储系统和线下数据存储系统;响应于在线预测请求,从线上数据存储系统中获取线上特征计算需要使用的至少部分数据。由此,通过在线上数据存储系统和线下数据存储系统之间进行数据同步,可以确保线上特征计算和线下特征计算时数据来源以及处理过程的一致性。

【技术实现步骤摘要】
利用机器学习模型进行线上预测的辅助实现方法及装置
本专利技术总体说来涉及人工智能领域,更具体地说,涉及一种利用机器学习模型进行线上预测的辅助实现方法及装置。
技术介绍
机器学习是人工智能研究发展到一定阶段的必然产物,其致力于通过计算的手段,利用经验来改善系统自身的性能。在计算机系统中,“经验”通常以“数据”形式存在,通过机器学习算法,可从数据中产生“模型”,也就是说,将经验数据提供给机器学习算法,就能基于这些经验数据产生模型,在面对新的情况时,模型会提供相应的判断,即,预测结果。在将机器学习模型应用于实际工业界时,为了将产出的机器学习模型应用于线上预测,需要面对数据来源和数据格式的复杂性,这给利用机器学习模型提供线上预测服务带来了很大困难。这是因为,在对模型进行离线训练时,会使用各种丰富的特征构建方式,不仅用到涉及多方面的数据,而且经常需要用到一些统计性特征(例如时序特征)。如何确保线上特征计算与线下特征计算时数据来源的一致性以及计算过程的一致性,是目前亟需解决的问题。
技术实现思路
本专利技术的示例性实施例本文档来自技高网...

【技术保护点】
1.一种利用机器学习模型进行线上预测的辅助实现方法,包括:/n设置线上数据存储系统和线下数据存储系统,其中,所述线上数据存储系统用于存储在线环境中进行特征计算所使用的至少部分数据,所述线下数据存储系统用于存储离线环境中进行特征计算所使用的至少部分数据;/n将数据分别存入所述线上数据存储系统和所述线下数据存储系统;/n响应于在线预测请求,从所述线上数据存储系统中获取线上特征计算需要使用的至少部分数据。/n

【技术特征摘要】
1.一种利用机器学习模型进行线上预测的辅助实现方法,包括:
设置线上数据存储系统和线下数据存储系统,其中,所述线上数据存储系统用于存储在线环境中进行特征计算所使用的至少部分数据,所述线下数据存储系统用于存储离线环境中进行特征计算所使用的至少部分数据;
将数据分别存入所述线上数据存储系统和所述线下数据存储系统;
响应于在线预测请求,从所述线上数据存储系统中获取线上特征计算需要使用的至少部分数据。


2.根据权利要求1所述的方法,其中,所述线上数据存储系统和/或所述线下数据存储系统用于存储多种类型的数据,该方法还包括:
针对每种类型的数据设置对应的数据获取方式;
使用所设置的数据获取方式获取对应类型的数据。


3.根据权利要求2所述的方法,其中,
所述数据包括静态特征数据,所述静态特征数据为不变或不常改变的特征数据,与所述静态特征数据对应的数据获取方式为周期性地获取静态特征数据。


4.根据权利要求3所述的方法,其中,所述静态特征数据保存在静态特征数据源中,将数据分别存入所述线上数据存储系统和所述线下数据存储系统的步骤包括:
将所述静态特征数据源中的静态特征数据发送给所述线上数据存储系统,并由所述线上数据存储系统将所述静态特征数据发送给所述线下数据存储系统;或者
将所述静态特征数据源中的静态特征数据发送给所述线下数据存储系统,并由所述线下数据存储系统将所述静态特征数据发送给所述线上数据存储系统;或者
将所述静态特征数据源中的静态特征数据分别发送给所述线上数据存储系统和所述线下数据存储系统。


5.根据权利要求2所述的方法,其中,
所述数据包括统计特征数据,所述统计特征数据为采用预定统计方式对预定时长范围内的数据进行统计得到的特征数据,...

【专利技术属性】
技术研发人员:陈庆杨慧斌杨守仁陈洁吴滔陈勃
申请(专利权)人:第四范式北京技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1