序列转换神经网络制造技术

技术编号：22334423 阅读：28 留言：0更新日期：2019-10-19 13:05

用于从输入序列生成目标序列的方法、系统和装置，包括编码在计算机存储介质上的计算机程序。一方面，该方法包括维护当前假设的集合，其中每个当前假设包括输入前缀和输出前缀。对于输入前缀和输出前缀长度的每个可能的组合，该方法扩展任何可以达到可能的组合的当前假设，以为每个这样的当前假设生成相应扩展假设；使用直接模型为每个扩展假设确定相应直接评分；根据直接评分确定第一数量的最高评分假设；使用噪声信道模型重新评分第一数量的最高评分假设，以生成数量减少的假设；以及将数量减少的假设添加到当前假设的集合中。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】序列转换神经网络相关申请的交叉引用本申请要求2016年11月4日提交的美国临时申请序列号62/418,170的优先权。在先申请的公开被认为是本申请的公开的一部分，并通过引用结合于此。
本说明书涉及使用神经网络生成输入序列的表示。
技术介绍
许多数据处理任务包括将有序的输入序列转换成有序的输出序列。例如，机器翻译系统将一种语言的输入单词序列翻译成另一种语言的单词序列。作为另一个示例，发音系统将字素的输入序列转换成音素的目标序列。
技术实现思路
本说明书描述了在一个或多个位置的一个或多个计算机上实施为计算机程序的序列转换系统。序列转换系统可以被配置为将输入序列映射到目标序列。例如，序列转换系统可以通过将源自然语言中的文本序列映射到目标自然语言中的翻译文本序列来实施机器翻译。自然语言处理领域中的其他应用包括文档概括，其中输入包括文档，输出包括较短的摘要；解析，其中输入包括句子，输出包括(线性化的)解析树；发音辅助，其中输入包括字素序列，输出包括音素序列；以及拼写校正，其中输入包括拼写错误的单词，输出包括预期单词。序列转换系统具有许多其他应用，例如语音识别，其中输入包括频谱系数或波形的编码，输出包括文本；文本到语音的转换，其中输入包括与文本应该如何发音相关联的语言特征的编码，输出包括波形；代码生成，其中输入包括算法的文本描述，输出包括程序；以及蛋白质二级结构预测，其中输入包括氨基酸序列，输出可以是编码二级结构类型的单热矢量。所描述的序列转换系统通过迭代构建当前假设的集合将输入序列映射到目标序列。每个假设都有输入前缀和对应的目标前缀。在每次迭代中，序列转换系统确定扩展假...

【技术保护点】
1.一种从输入序列生成目标序列的计算机实施的方法，所述方法包括：维护当前假设的集合，其中每个当前假设包括输入前缀和相应长度为j的目标前缀，所述输入前缀覆盖所述输入序列中的相应的第一数量i个输入，并且其中每个当前假设具有相应的模型评分；以及对于输入数量i和输出前缀长度j的多个可能的组合中的每一个：通过对一个或多个当前假设中的每一个，将当前假设的目标前缀扩展一个目标标记并且不扩展所述输入前缀或者将所述输入前缀扩展一个或多个输入标记来从当前假设的集合中扩展一个或多个当前假设以达到所述可能的组合，以生成所述当前假设的扩展假设；以及使用直接模型确定每个扩展假设的相应的直接评分；根据所述直接评分确定第一数量的最高评分假设；使用噪声信道模型对所述第一数量的最高评分假设重新评分，以生成数量减少的假设；以及将所述数量减少的假设添加到当前假设的集合并将每个假设与由重新评分所生成的对应的评分相关联。

【技术特征摘要】
【国外来华专利技术】2016.11.04 US 62/418,1701.一种从输入序列生成目标序列的计算机实施的方法，所述方法包括：维护当前假设的集合，其中每个当前假设包括输入前缀和相应长度为j的目标前缀，所述输入前缀覆盖所述输入序列中的相应的第一数量i个输入，并且其中每个当前假设具有相应的模型评分；以及对于输入数量i和输出前缀长度j的多个可能的组合中的每一个：通过对一个或多个当前假设中的每一个，将当前假设的目标前缀扩展一个目标标记并且不扩展所述输入前缀或者将所述输入前缀扩展一个或多个输入标记来从当前假设的集合中扩展一个或多个当前假设以达到所述可能的组合，以生成所述当前假设的扩展假设；以及使用直接模型确定每个扩展假设的相应的直接评分；根据所述直接评分确定第一数量的最高评分假设；使用噪声信道模型对所述第一数量的最高评分假设重新评分，以生成数量减少的假设；以及将所述数量减少的假设添加到当前假设的集合并将每个假设与由重新评分所生成的对应的评分相关联。2.如权利要求1所述的方法，其中，扩展所述当前假设包括扩展能够达到所述可能的组合的任何当前假设，以为每个这样的当前假设生成相应的扩展假设。3.如权利要求1或2所述的方法，其中，所述噪声信道模型包括：生成以目标前缀为条件的输入前缀的可能性的信道模型；以及生成目标前缀的可能性的源模型。4.如权利要求3所述的方法，其中，所述源模型是以所述目标序列中的在前的标记为条件生成目标序列中的最后的标记的可能性的语言模型。5.如权利要求3或4中任一项所述的方法，其中，所述信道模型是分段到分段神经转换(SSNT)模型。6.如权利要求1-5中任一项所述的方法，其中，所述方法还包括：确定当前假设的集合是完整的；以及作为响应，将具有最高评分并且对应的输入前缀是整个输入序列的假设作为所述输入序列的所述目标序列输出。7.如前述权利要求中任一项所述的方法，其中，所述直接模型生成以输入前缀为条件的目标前缀的概率。8.如从属于权利要求3时的权利要求3-7中任一项所述的方法，其中对所述第一数量的最高评分假设重新评分包括使用组合模型对所述第一数量的最高评分假设重新评分，并且其中所述组合模型基于所述直接模型、所述噪声信道模型和目标前缀的长度为假设生成评分。9.如权利要求8所述的方法，其中，所述组合模型为假设生成的评分是所述直接模型为假设生成的评分的对数、所述信道模型为假设生成的可能性的对数、所述源模型为假设生成的可能性的对数以及假设的目标前缀的长度的加权线性组合。10.如权利要求9所述的方法，其中，使用从训练数据集保存的开发数据来调整所述加权线性组合的权重。11.如从属于权利要求3时的权...

【专利技术属性】
技术研发人员：L于，CJ戴尔，T科西斯基，P布伦索姆，
申请(专利权)人：渊慧科技有限公司，
类型：发明
国别省市：英国,GB

全部详细技术资料下载我是这个专利的主人