一种目标数据的预测方法和装置制造方法及图纸

技术编号:28038565 阅读:22 留言:0更新日期:2021-04-09 23:21
本发明专利技术提供了一种目标数据的预测方法和装置,涉及神经网络技术领域。其中,所述方法包括:获取满足长期依赖性条件的多个第一目标数据;将多个第一目标数据输入至神经网络模型中输出第二目标数据;第二目标数据与多个第一目标数据具有序列相关性;神经网络模型通过以下步骤训练得到:将样本数据集划分为多个批次的输入项,按照批次的顺序将输入项输入至初始网络模型,根据膨胀卷积算法计算得到初始网络模型的输出项,根据输入项、输出项和损失函数对初始网络模型进行训练得到神经网络模型。本发明专利技术提供的目标数据的预测方法和装置,利用训练完毕的神经网络模型为具有超长依赖关系的多个第一目标数据,快速地预测出具有序列相关性的第二目标数据。

【技术实现步骤摘要】
一种目标数据的预测方法和装置
本专利技术涉及神经网络
,特别是涉及一种目标数据的预测方法和装置。
技术介绍
自然语言处理(NaturalLanguageProcessing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。自然语言处理可以应用于多个
,例如,在语音识别领域中,对前文进行自然语言处理,从而预测出后文。在量化交易领域中,对历史价格进行自然语言处理,从而预测出未来价格。在智能推荐领域中,对用户过往浏览记录进行自然语言处理,从而预测出用户感兴趣的内容。但是,目前常见的自然语言处理过程存在无法同时兼顾快速预测和捕获超长依赖的问题。本文档来自技高网...

【技术保护点】
1.一种目标数据的预测方法,其特征在于,所述方法包括:/n获取满足预设的长期依赖性条件的多个第一目标数据;/n将多个所述第一目标数据输入至训练完毕的神经网络模型中,输出第二目标数据;/n其中,所述第二目标数据与多个所述第一目标数据具有序列相关性;/n所述神经网络模型通过以下步骤训练得到:/n将样本数据集划分为多个批次的输入项,并按照批次的顺序将所述输入项输入至初始网络模型,根据膨胀卷积算法计算得到所述初始网络模型的输出项,根据所述输入项、所述输出项和损失函数对所述初始网络模型进行训练,得到所述神经网络模型。/n

【技术特征摘要】
1.一种目标数据的预测方法,其特征在于,所述方法包括:
获取满足预设的长期依赖性条件的多个第一目标数据;
将多个所述第一目标数据输入至训练完毕的神经网络模型中,输出第二目标数据;
其中,所述第二目标数据与多个所述第一目标数据具有序列相关性;
所述神经网络模型通过以下步骤训练得到:
将样本数据集划分为多个批次的输入项,并按照批次的顺序将所述输入项输入至初始网络模型,根据膨胀卷积算法计算得到所述初始网络模型的输出项,根据所述输入项、所述输出项和损失函数对所述初始网络模型进行训练,得到所述神经网络模型。


2.根据权利要求1所述的方法,其特征在于,所述将样本数据集划分为多个批次的输入项,包括:
将所述样本数据集中的每个样本数据转换为样本向量;
按照预设的长度,将全部所述样本向量划分为多个批次的所述输入项;
其中,所述样本数据的数量除以所述长度等于所述批次的数量。


3.根据权利要求1所述的方法,其特征在于,在所述将样本数据集划分为多个批次的输入项之后,所述方法还包括:
分别将每个所述输入项向后偏移一位所述样本向量,并按照所述长度划分得到每个所述输入项对应的标注数据。


4.根据权利要求1所述的方法,其特征在于,所述按照批次的顺序将所述输入项输入至初始网络模型,包括:
将当前的所述输入项与所述初始网络模型中上一个网络层的所述输出项进行拼接;
将拼接后的样本向量输入至所述初始网络模型中的当前网络层。


5.根据权利要求2至4中任一项所述的方法,其特征在于,所述神经网络模型的网络层包含多个膨胀卷积层,每个膨胀卷积层的存储空间为所述长度与所述样本向量的维度相乘的矩阵空间。


6.一种目...

【专利技术属性】
技术研发人员:吴帅李健陈明武卫东
申请(专利权)人:北京捷通华声科技股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1