生成文档的矢量表示制造技术

技术编号：13707334 阅读：38 留言：0更新日期：2016-09-14 23:32

包括在计算机存储介质上编码的计算机程序的方法、系统以及装置，用于生成文档矢量表示。所述方法中的一个包括：获得新文档；以及使用经训练的神经网络系统来确定所述新文档的矢量表示，其中，所述经训练的神经网络系统已被训练成接收输入文档以及来自所述输入文档的单词序列并且生成单词集中的每个单词的相应单词分数，其中，所述相应单词分数中的每一个都表示对应单词跟随所述输入文档中的所述序列中的最后一个单词的预测似然率，并且其中，使用经训练的神经网络系统来确定所述新文档的矢量表示包括迭代地将所述多个单词序列中的每一个提供给所述经训练的神经网络系统以使用梯度下降来确定所述新文档的所述矢量表示。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
本说明书涉及使用数据处理系统的文本分类。文本分类系统能够对电子文本段进行分类，例如电子文档。例如，文本分类系统能够将文本段分类为与预定的主题集中的一个或多个相关。一些文本分类系统接收文本段的特征作为输入并且使用所述特征来生成所述文本段的分类。神经网络是机器学习模型，其采用模型的一个或多个层来生成针对所接收的输入的输出，例如分类。一些神经网络除输出层之外还包括一个或多个隐藏层。每个隐藏层的输出被用作到网络中的下一层的输入，即，网络的下一个隐藏层或者输出层。网络的每个层都根据相应的参数集的当前值而从所接收的输入中生成输出。
技术实现思路
一般而言，在本说明书中所述主题的一个创新方面能够被体现在包括以下动作的方法中：获得新文档，其中，所述新文档包括多个单词序列，并且针对每个单词序列包括跟随所述新文档中的所述单词序列中的最后一个单词的单词；以及使用经训练的神经网络系统来确定所述新文档的矢量表示，其中，所述经训练的神经网络系统已被训练成接收输入文档以及来自所述输入文档的单词序列并且生成预定单词集中的每个单词的相应单词分数，其中，所述相应单词分数中的每一个都表示对应单词跟随所述输入文档中的所述序列中的最后一个单词的预测似然率，并且其中，使用经训练的神经网络系统来确定所述新文档的矢量表示包括迭代地将所述多个单词序列中的每一个提供给所述经训练的神经网络系统以使用梯度下降来确定所述新文档的所述矢
量表示。该方面的其他实施例包括对应的计算机系统、装置以及被记录在一个或多个计算机存储设备上的计算机程序，每个计算机存储设备都被配置成执行所述方法的所述动作。一个或...

【技术保护点】
一种方法，包括：获得新文档，其中，所述新文档包括多个单词序列，并且针对每个单词序列，包括跟随所述新文档中的所述单词序列中的最后一个单词的单词；以及使用经训练的神经网络系统来确定所述新文档的矢量表示，其中，所述经训练的神经网络系统已被训练用于接收输入文档以及来自所述输入文档的单词序列，并且用于生成预定单词集中的每个单词的相应单词分数，其中，所述相应单词分数中的每一个表示对应单词跟随所述输入文档中的所述序列中的最后一个单词的预测似然率，并且其中，使用所述经训练的神经网络系统来确定所述新文档的所述矢量表示包括：迭代地将所述多个单词序列中的每一个提供给所述经训练的神经网络系统，以使用梯度下降来确定所述新文档的所述矢量表示。

【技术特征摘要】
【国外来华专利技术】2014.01.31 US 61/934,6741.一种方法，包括：获得新文档，其中，所述新文档包括多个单词序列，并且针对每个单词序列，包括跟随所述新文档中的所述单词序列中的最后一个单词的单词；以及使用经训练的神经网络系统来确定所述新文档的矢量表示，其中，所述经训练的神经网络系统已被训练用于接收输入文档以及来自所述输入文档的单词序列，并且用于生成预定单词集中的每个单词的相应单词分数，其中，所述相应单词分数中的每一个表示对应单词跟随所述输入文档中的所述序列中的最后一个单词的预测似然率，并且其中，使用所述经训练的神经网络系统来确定所述新文档的所述矢量表示包括：迭代地将所述多个单词序列中的每一个提供给所述经训练的神经网络系统，以使用梯度下降来确定所述新文档的所述矢量表示。2.如权利要求1所述的方法，其中，所述经训练的神经网络系统包括：嵌入层，所述嵌入层被配置成将所述输入文档以及来自所述输入文档的所述单词序列中的每个单词映射到相应的矢量表示；组合层，所述组合层被配置成将所述矢量表示组合成组合表示；以及，分类器层，所述分类器层被配置成使用所述组合表示来生成所述单词分数。3.如权利要求2所述的方法，其中，根据第一参数集，所述嵌入层将所述单词序列中的所述单词映射到矢量表示，并且其中，根据第二参数集，所述分类器层从所述组合表示中生成所述单词分数。4.如权利要求3所述的方法，其中，自从训练所述神经网络系统以生成所述单词分数，所述第一参数集的值以及所述第二参数集的
\t值是固定的。5.如权利要求2所述的方法，其中，使用所述经训练的神经网络系统来确定所述新文档的所述矢量表示包括：对于所述多个单词序列中的每一个执行梯度下降的相应迭代，以调节来自梯度下降的先前迭代的所述新文档的所述矢量表示。6.如权利要求5所述的方法，其中，对于所述多个序列中的每一个执行梯度下降的相应迭代包括：使用所述嵌入层，将所述序列中的所述单词中的每一个映射到矢量表示；将所述序列中的所述单词的所述矢量表示与来自所述先前迭代的所述新文档的所述矢量表示进行组合，以生成组合表示；从所述组合表示中生成单词分数；使用所述单词分数以及跟随所述新文档中的所述序列的所述单词来计算梯度；以及使用所述梯度来调节来自所述先前迭代的所述新文档的所述矢量表示。7.如权利要求2所述的方法，其中，所述组合层被配置成将所述序列中的所述单词的所述矢量表示与所述输入文档的所述矢量表示相连结。8.如权利要求2所述的方法，其中，所述组合层被配置成对所述序列中的所述单词的所述矢量表示与所述输入文档的所述矢量表示取平均值。9.如权利要求1所述的方法，其中，所述多个单词序列中的每一个包含固定数目的单词。10.一种方法，包括：获得多个训练文档，其中，所述多个训练文档中的每个文档包括多个训练单词序列，并且针对每个单词序列，包括跟随所述训练文档中的所述训练单词序列中的最后一个单词的单词；以及使用梯度下降以及反向传播，来依靠所述训练文档中的每一个训练神经网络系统，其中，所述神经网络系统被配置成接收识别输入文档以及来自所述输入文档的输入单词序列的数据，并且生成预定单词集中的每个单词的相应单词分数，其中，所述相应单词分数中的每一个表示对应单词跟随所述输入文档中的所述序列中的最后一个单词的预测似然率，并且其中，依靠所述训练文档中的每...

【专利技术属性】
技术研发人员：国·V·勒，
申请(专利权)人：谷歌公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人