The invention relates to an information processing method, device, computer equipment and storage medium. The method includes: acquiring raw data to be processed; inputting the raw data to be processed into the coding model of the trained machine learning model to obtain the corresponding coding vector; and inputting the coding vector into the middle of the machine learning model. In the physical model, a sequence of intermediate vectors is obtained, in which the intermediate processing model includes multiple sub-learning models, each sub-learning model includes multiple cyclic neural network units. The output of the current cyclic neural network unit is based on the first output vector corresponding to the forward cyclic neural network unit and the current cyclic neural network single. The forward vector sequence of meta-corresponding forward sub-learning model output is obtained; the intermediate vector sequence is input into the decoding model of machine learning model, and the target output data corresponding to the original data to be processed is obtained. The above method can improve the accuracy of output data.
【技术实现步骤摘要】
信息处理方法、装置、计算机设备和存储介质
本专利技术涉及信息处理领域,特别是涉及信息处理方法、装置、计算机设备和存储介质。
技术介绍
随着信息技术的发展,将输入的数据转换为另外一种数据输出的需求越来越多。例如,需要将一种语言文字表示的句子翻译成另一种语言文字输出以及将不完整的句子进行补全等。目前,可以基于Encoder-Decoder(编码模型-解码模型)的框架将输入数据序列转换为另一个序列输出,在该框架中,编码模型对输入数据进行编码,得到编码向量,解码模型对编码向量进行解码,得到输出数据。然而,上述框架中,编码向量得到的编码向量不能完全反映输入数据中各个数据间的关系,导致输出数据的准确度高。
技术实现思路
基于此,有必要针对上述的问题,提供一种信息处理方法、装置、计算机设备和存储介质,在编码模型以及解码模型中增加中间处理模型,中间处理模型包括多个子学习模型,各个子学习模型包括多个循环神经网络单元,当前循环神经网络单元的输出是根据前向循环神经网络单元对应的第一输出向量以及当前循环神经网络单元对应的前向子学习模型输出的前向向量序列得到的,各个循环神经网络单元得到的向量与 ...
【技术保护点】
1.一种信息处理方法,所述方法包括:获取待处理原始数据;将所述待处理原始数据输入到已训练的机器学习模型的编码模型中,得到对应的编码向量;将所述编码向量输入到所述机器学习模型的中间处理模型中,得到中间向量序列,其中,所述中间处理模型包括多个子学习模型,各个子学习模型包括多个循环神经网络单元,当前循环神经网络单元的输出是根据前向循环神经网络单元对应的第一输出向量以及所述当前循环神经网络单元对应的前向子学习模型输出的前向向量序列得到的;将所述中间向量序列输入到所述机器学习模型的解码模型中,得到所述待处理原始数据对应的目标输出数据。
【技术特征摘要】
1.一种信息处理方法,所述方法包括:获取待处理原始数据;将所述待处理原始数据输入到已训练的机器学习模型的编码模型中,得到对应的编码向量;将所述编码向量输入到所述机器学习模型的中间处理模型中,得到中间向量序列,其中,所述中间处理模型包括多个子学习模型,各个子学习模型包括多个循环神经网络单元,当前循环神经网络单元的输出是根据前向循环神经网络单元对应的第一输出向量以及所述当前循环神经网络单元对应的前向子学习模型输出的前向向量序列得到的;将所述中间向量序列输入到所述机器学习模型的解码模型中,得到所述待处理原始数据对应的目标输出数据。2.根据权利要求1所述的方法,其特征在于,所述当前循环神经网络单元的输出通过以下步骤得到:获取前向循环神经网络单元对应的第一输出向量,获取所述当前循环神经网络单元对应的前向子学习模型输出的前向向量序列;确定所述前向向量序列中的各个前向向量对应的第一注意力分配权重系数;根据所述前向向量以及对应的第一注意力分配权重系数确定所述前向向量序列对应的第一注意力向量;将所述第一输出向量以及所述第一注意力向量输入到所述当前循环神经网络单元中,得到对应的当前输出向量。3.根据权利要求2所述的方法,其特征在于,所述确定所述前向向量序列中的各个前向向量对应的第一注意力分配权重系数包括:分别计算所述各个前向向量与所述第一输出向量对应的相关度;根据所述各个前向向量与所述第一输出向量对应的相关度计算得到所述各个前向向量对应的第一注意力分配权重系数。4.根据权利要求2所述的方法,其特征在于,所述将所述待处理原始数据输入到已训练的机器学习模型的编码模型中,得到对应的编码向量包括:对所述待处理原始数据进行分割,得到所述待处理原始数据对应的分割数据序列;将所述分割数据序列输入到所述编码模型中,得到所述各个分割数据对应的编码向量;所述方法还包括:确定所述各个分割数据对应的编码向量对应的第二注意力分配权重系数;根据所述各个编码向量以及对应的第二注意力分配权重系数确定第二注意力向量;所述将所述第一输出向量以及所述第一注意力向量输入到所述当前神经网络单元中,得到对应的当前输出向量包括:将所述第一输出向量、所述第一注意力向量以及所述第二注意力向量输入到当前神经网络单元中,得到当前输出向量。5.根据权利要求1所述的方法,其特征在于,所述将所述编码向量输入到所述机器学习模型的中间处理模型中,得到中间向量序列包括:获取所述中间处理模型最后一个子学习模型中各个循环神经网络单元对应的输出向量,将所述最后一个子学习模型中各个循环神经网络单元的输出向量组成所述中间向量序列。6.根据权利要求1所述的方法,其特征在于,所述前向循环神经网络单元对应的第一输出向量的获取步骤包括:获取与当前子学习模型连接的上一个子学习模型中尾部神经网络单元对应的第一单元输出向量,所述当前子学习模型为所述当前循环神经网络单元所在的子学习模型;在当前子学习模型中获取当前循环神经网络单元对应的前向神经网络单元对应的第二单元输出向量;根据所述第一单元输出向量和所述第二单元输出向量得到所述第一输出向量。7.根据权利要求1所述的方法,其特征在于,所述目标输出数据为目标词序列,所述将所述中间向量序列输入到所述机器学习模型的解码模型中,得到所述待处理原始数据对应的目标输出数据包括:确定所述中间向量序列对应的中间向量对应的第三注意力分配权重系数;根据所述各个中间向量以及对应的第三注意力分配权重系数确定第三注意力向量;将所述解码模型上一时刻的输出词对应的词向量以及所述第三注意力向量输入到所述解码模型中,得到所述解码模型在当前时刻的当前输出词;根据所述解码模型在各个时刻的输出词以及输出顺序得到目标词序列,作为所述待处理原始数据对应的目标输出数据。8.根据权利要求1所述的方法,其特征在于,所述目标输出数据为目标词序列,所述机器学习模型的训练步骤包括:获取样本集中的训练样本数据,所述训练样本...
【专利技术属性】
技术研发人员:姜文浩,马林,刘威,张潼,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。