用于处理数据的方法和装置制造方法及图纸

技术编号:20867982 阅读:41 留言:0更新日期:2019-04-17 09:38
本申请实施例公开了用于处理数据的方法和装置。该方法的一具体实施方式包括:获取待处理的、包含有至少一个预设标识的数据序列,预设标识用于表示数据序列的缺失值;对于数据序列中的数据,执行如下处理步骤:响应于确定该数据为预设标识,确定预先指定的、与该数据对应的、数据序列中的数据作为该数据对应的目标数据,根据预先训练的、用于处理数据序列的循环神经网络所包括的、用于处理目标数据的子神经网络的输出结果,对该数据进行赋值,以及确定该数据被赋的值作为循环神经网络包括的、用于处理该数据的子神经网络的输入,以得到用于处理该数据的子神经网络的输出结果。该实施方式实现了循环神经网络对具有缺失值的数据序列的有效处理。

【技术实现步骤摘要】
用于处理数据的方法和装置
本申请实施例涉及计算机
,具体涉及用于处理数据的方法和装置。
技术介绍
循环神经网络是一种节点定向连接成环的人工神经网络。循环神经网络的处理单元之间既有内部的反馈连接又有前馈连接。因此,循环神经网络的内部状态可以展示动态时序行为。循环神经网络可以接收时间序列数据作为输入,以及对时间序列数据进行分析。
技术实现思路
本申请实施例提出了用于处理数据方法和装置。第一方面,本申请实施例提供了一种用于处理数据的方法,该方法包括:获取待处理的、包含有至少一个预设标识的数据序列,其中,预设标识用于表示数据序列的缺失值;对于数据序列中的数据,执行如下处理步骤:响应于确定该数据为预设标识,确定预先指定的、与该数据对应的、数据序列中的数据作为该数据对应的目标数据,根据预先训练的、用于处理数据序列的循环神经网络所包括的、用于处理目标数据的子神经网络的输出结果,对该数据进行赋值,以及确定该数据被赋的值作为循环神经网络包括的、用于处理该数据的子神经网络的输入,以得到用于处理该数据的子神经网络的输出结果。在一些实施例中,处理步骤还包括:响应于确定该数据不为预设标识,确定该数据作为循环本文档来自技高网...

【技术保护点】
1.一种用于处理数据的方法,包括:获取待处理的、包含有至少一个预设标识的数据序列,其中,预设标识用于表示所述数据序列的缺失值;对于所述数据序列中的数据,执行如下处理步骤:响应于确定该数据为预设标识,确定与该数据对应的、所述数据序列中的数据作为该数据对应的目标数据,根据预先训练的、用于处理所述数据序列的循环神经网络所包括的、用于处理所述目标数据的子神经网络的输出结果,对该数据进行赋值,以及确定该数据被赋的值作为所述循环神经网络包括的、用于处理该数据的子神经网络的输入,以得到用于处理该数据的子神经网络的输出结果。

【技术特征摘要】
1.一种用于处理数据的方法,包括:获取待处理的、包含有至少一个预设标识的数据序列,其中,预设标识用于表示所述数据序列的缺失值;对于所述数据序列中的数据,执行如下处理步骤:响应于确定该数据为预设标识,确定与该数据对应的、所述数据序列中的数据作为该数据对应的目标数据,根据预先训练的、用于处理所述数据序列的循环神经网络所包括的、用于处理所述目标数据的子神经网络的输出结果,对该数据进行赋值,以及确定该数据被赋的值作为所述循环神经网络包括的、用于处理该数据的子神经网络的输入,以得到用于处理该数据的子神经网络的输出结果。2.根据权利要求1所述的方法,其中,所述处理步骤还包括:响应于确定该数据不为预设标识,确定该数据作为所述循环神经网络所包括的、用于处理该数据的子神经网络的输入,以得到用于处理该数据的子神经网络的输出结果。3.根据权利要求1所述的方法,其中,所述方法还包括:确定所述数据序列中的数据对应的输出结果作为所述循环神经网络所包括的、用于处理所述数据序列中的数据对应的输出结果的子神经网络的输入,以及将用于处理所述数据序列中的数据对应的输出结果的子神经网络的输出结果确定为所述数据序列对应的处理结果。4.根据权利要求1所述的方法,其中,所述目标数据为按照所述循环神经网络对所述数据序列中的数据由先到后的处理次序,该数据的前预设数目个被处理的数据。5.根据权利要求1所述的方法,其中,所述循环神经网络通过如下步骤训练得到:获取训练样本集,其中,训练样本包括包含有至少一个预设标识的数据序列和数据序列对应的处理结果;利用机器学习的方法,将所述训练样本集中的训练样本中的数据序列作为初始循环神经网络的输入,将与输入的数据序列对应的处理结果作为初始循环神经网络的期望输出,训练得到所述循环神经网络。6.根据权利要求1-5之一所述的方法,其中,所述数据序列中的数据用于表示目标对象的属性值;以及所述循环神经网络用于预测所述目标对象的属性值,或所述循环神经网络用于确定所述目标对象是否属于预设类别。7.一种用于处理数据的装置,包括:获取单元,被配置成获取待处理的、包含有至少一个预设标识的数据序列,其中,预设标识用于表示所述数据序列的缺失值;处理单元,被配置成对于所述数据序列中的数据...

【专利技术属性】
技术研发人员:李亦锬曹玮周浩李磊
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1