一种目标数据的预测方法和装置制造方法及图纸

技术编号:28038565 阅读:11 留言:0更新日期:2021-04-09 23:21
本发明专利技术提供了一种目标数据的预测方法和装置,涉及神经网络技术领域。其中,所述方法包括:获取满足长期依赖性条件的多个第一目标数据;将多个第一目标数据输入至神经网络模型中输出第二目标数据;第二目标数据与多个第一目标数据具有序列相关性;神经网络模型通过以下步骤训练得到:将样本数据集划分为多个批次的输入项,按照批次的顺序将输入项输入至初始网络模型,根据膨胀卷积算法计算得到初始网络模型的输出项,根据输入项、输出项和损失函数对初始网络模型进行训练得到神经网络模型。本发明专利技术提供的目标数据的预测方法和装置,利用训练完毕的神经网络模型为具有超长依赖关系的多个第一目标数据,快速地预测出具有序列相关性的第二目标数据。

【技术实现步骤摘要】
一种目标数据的预测方法和装置
本专利技术涉及神经网络
,特别是涉及一种目标数据的预测方法和装置。
技术介绍
自然语言处理(NaturalLanguageProcessing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。自然语言处理可以应用于多个
,例如,在语音识别领域中,对前文进行自然语言处理,从而预测出后文。在量化交易领域中,对历史价格进行自然语言处理,从而预测出未来价格。在智能推荐领域中,对用户过往浏览记录进行自然语言处理,从而预测出用户感兴趣的内容。但是,目前常见的自然语言处理过程存在无法同时兼顾快速预测和捕获超长依赖的问题。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种目标数据的预测方法和装置。依据本专利技术的第一方面,提供了一种目标数据的预测方法,该方法包括:获取满足预设的长期依赖性条件的多个第一目标数据;将多个所述第一目标数据输入至训练完毕的神经网络模型中,输出第二目标数据;其中,所述第二目标数据与多个所述第一目标数据具有序列相关性;所述神经网络模型通过以下步骤训练得到:将样本数据集划分为多个批次的输入项,并按照批次的顺序将所述输入项输入至初始网络模型,根据膨胀卷积算法计算得到所述初始网络模型的输出项,根据所述输入项、所述输出项和损失函数对所述初始网络模型进行训练,得到所述神经网络模型。可选地,所述将样本数据集划分为多个批次的输入项,包括:将所述样本数据集中的每个样本数据转换为样本向量;按照预设的长度,将全部所述样本向量划分为多个批次的所述输入项;其中,所述样本数据的数量除以所述长度等于所述批次的数量。可选地,在所述将样本数据集划分为多个批次的输入项之后,所述方法还包括:分别将每个所述输入项向后偏移一位所述样本向量,并按照所述长度划分得到每个所述输入项对应的标注数据。可选地,所述按照批次的顺序将所述输入项输入至初始网络模型,包括:将当前的所述输入项与所述初始网络模型中上一个网络层的所述输出项进行拼接;将拼接后的样本向量输入至所述初始网络模型中的当前网络层。可选地,所述神经网络模型的网络层包含多个膨胀卷积层,每个膨胀卷积层的存储空间为所述长度与所述样本向量的维度相乘的矩阵空间。依据本专利技术的第二方面,提供了一种目标数据的预测装置,该装置包括:获取模块,用于获取满足预设的长期依赖性条件的多个第一目标数据;输入模块,用于将多个所述第一目标数据输入至训练完毕的神经网络模型中,输出第二目标数据;其中,所述第二目标数据与多个所述第一目标数据具有序列相关性;所述装置还包括:训练模块,用于将样本数据集划分为多个批次的输入项,并按照批次的顺序将所述输入项输入至初始网络模型,根据膨胀卷积算法计算得到所述初始网络模型的输出项,根据所述输入项、所述输出项和损失函数对所述初始网络模型进行训练,得到所述神经网络模型。可选地,所述训练模块,包括:样本转换模块,用于将所述样本数据集中的每个样本数据转换为样本向量;样本划分模块,用于按照预设的长度,将全部所述样本向量划分为多个批次的所述输入项;其中,所述样本数据的数量除以所述长度等于所述批次的数量。可选地,所述训练模块,还包括:样本标注模块,用于在所述样本划分模块将全部所述样本向量划分为多个批次的所述输入项之后,分别将每个所述输入项向后偏移一位所述样本向量,并按照所述长度划分得到每个所述输入项对应的标注数据。可选地,所述训练模块,包括:样本拼接模块,用于将当前的所述输入项与所述初始网络模型中上一个网络层的所述输出项进行拼接;将拼接后的样本向量输入至所述初始网络模型中的当前网络层。可选地,所述神经网络模型的网络层包含多个膨胀卷积层,每个膨胀卷积层的存储空间为所述长度与所述样本向量的维度相乘的矩阵空间。本专利技术实施例可以具有以下有益效果:本专利技术实施例提供的一种目标数据的预测方法和装置,获取满足预设的长期依赖性条件的多个第一目标数据,将多个第一目标数据输入至训练完毕的神经网络模型中,输出第二目标数据。其中,多个第一目标数据与第二目标数据具有序列相关性。上述满足长期依赖性条件的多个第一目标数据可以理解为具有超长依赖关系的多个第一目标数据。也就是说,利用上述神经网络模型可以为具有超长依赖关系的多个第一目标数据,预测出具有序列相关性的第二目标数据。而且,上述神经网络模型的训练步骤可以包含:将样本数据集划分为多个批次的输入项,并按照批次的顺序将输入项输入至初始网络模型,根据膨胀卷积算法计算得到初始网络模型的输出项,根据输入项、输出项和损失函数对初始网络模型进行训练,得到神经网络模型。也就是说,在上述神经网络模型的训练过程中,利用膨胀卷积算法根据输入项计算得到输出项。膨胀卷积算法具有计算速度快的优点,因此,上述神经网络模型也具有快速预测结果的优点。即上述神经网络模型可以快速地为第一目标数据预测第二目标数据。综上所述,本专利技术实施例可以利用训练完毕的神经网络模型为具有超长依赖关系的多个第一目标数据,快速地预测出具有序列相关性的第二目标数据。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了本专利技术实施例一的一种目标数据的预测方法的流程示意图;图2示出了本专利技术实施例二的一种神经网络模型的训练方法的流程示意图;图3示出了本专利技术实施例的初始网络模型的网络结构示意图;图4示出了本专利技术实施例的一种神经网络模型的网络结构示意图;图5示出了本专利技术实施例三的一种目标数据的预测装置的结构示意图。具体实施方式下面将参照附图更详细地描述本专利技术的示例性实施例。虽然附图中显示了本专利技术的示例性实施例,然而应当理解,可以以各种形式实现本专利技术而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本专利技术,并且能够将本专利技术的范围完整的传达给本领域的技术人员。实施例一参照图1,图1示出了本专利技术实施例一的一种目标数据的预测方法的流程示意图。本专利技术实施例提供的目标数据的预测方法,具体可以包含如下步骤。...

【技术保护点】
1.一种目标数据的预测方法,其特征在于,所述方法包括:/n获取满足预设的长期依赖性条件的多个第一目标数据;/n将多个所述第一目标数据输入至训练完毕的神经网络模型中,输出第二目标数据;/n其中,所述第二目标数据与多个所述第一目标数据具有序列相关性;/n所述神经网络模型通过以下步骤训练得到:/n将样本数据集划分为多个批次的输入项,并按照批次的顺序将所述输入项输入至初始网络模型,根据膨胀卷积算法计算得到所述初始网络模型的输出项,根据所述输入项、所述输出项和损失函数对所述初始网络模型进行训练,得到所述神经网络模型。/n

【技术特征摘要】
1.一种目标数据的预测方法,其特征在于,所述方法包括:
获取满足预设的长期依赖性条件的多个第一目标数据;
将多个所述第一目标数据输入至训练完毕的神经网络模型中,输出第二目标数据;
其中,所述第二目标数据与多个所述第一目标数据具有序列相关性;
所述神经网络模型通过以下步骤训练得到:
将样本数据集划分为多个批次的输入项,并按照批次的顺序将所述输入项输入至初始网络模型,根据膨胀卷积算法计算得到所述初始网络模型的输出项,根据所述输入项、所述输出项和损失函数对所述初始网络模型进行训练,得到所述神经网络模型。


2.根据权利要求1所述的方法,其特征在于,所述将样本数据集划分为多个批次的输入项,包括:
将所述样本数据集中的每个样本数据转换为样本向量;
按照预设的长度,将全部所述样本向量划分为多个批次的所述输入项;
其中,所述样本数据的数量除以所述长度等于所述批次的数量。


3.根据权利要求1所述的方法,其特征在于,在所述将样本数据集划分为多个批次的输入项之后,所述方法还包括:
分别将每个所述输入项向后偏移一位所述样本向量,并按照所述长度划分得到每个所述输入项对应的标注数据。


4.根据权利要求1所述的方法,其特征在于,所述按照批次的顺序将所述输入项输入至初始网络模型,包括:
将当前的所述输入项与所述初始网络模型中上一个网络层的所述输出项进行拼接;
将拼接后的样本向量输入至所述初始网络模型中的当前网络层。


5.根据权利要求2至4中任一项所述的方法,其特征在于,所述神经网络模型的网络层包含多个膨胀卷积层,每个膨胀卷积层的存储空间为所述长度与所述样本向量的维度相乘的矩阵空间。


6.一种目...

【专利技术属性】
技术研发人员:吴帅李健陈明武卫东
申请(专利权)人:北京捷通华声科技股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1