神经网络语言模型、文本预测方法、装置及存储介质制造方法及图纸

技术编号：21914036 阅读：20 留言：0更新日期：2019-08-21 12:27

本发明专利技术实施例公开了一种神经网络语言模型、文本预测方法、装置及存储介质；神经网络语言模型包括：输入层，用于将输入的文本映射为相应的特征向量；隐藏层，用于调用激活函数，输出对应特征向量的第一隐层表达至输出层；输出层，用于将第一隐层表达进行分解，得到第一隐层表达分别在不同隐主题下对应的第二隐层表达；以及，分别确定每个第二隐层表达所对应的聚类，并调用所述聚类对应的归一化指数函数得到第二隐层表达对应的概率分布；其中，聚类包括头聚类及尾聚类，头聚类中文本分类的输出概率不同于尾聚类中文本分类的输出概率；以及，融合各第二隐层表达对应的概率分布，并基于融合后得到的概率分布输出对应所述文本的目标文本。

Neural Network Language Model, Text Prediction Method, Device and Storage Media

全部详细技术资料下载

【技术实现步骤摘要】
神经网络语言模型、文本预测方法、装置及存储介质
本专利技术涉及自然语言处理技术，尤其涉及一种神经网络语言模型、文本预测方法、装置及存储介质。
技术介绍
随着自然语言处理技术的发展，基于循环神经网络(RNN，RecurrentNeuralNetwork)架构的语言模型被越来越多的应用于处理多分类问题，然而当所要处理的类别巨大(如100K甚至1B)时，相关技术中的语言模型的训练效率低下，甚至由于计算资源受限导致无法进行训练。
技术实现思路
本专利技术实施例提供一种神经网络语言模型、文本预测方法、装置及存储介质，能够提升语言模型的表征能力，提高语言模型的训练效率。本专利技术实施例的技术方案是这样实现的：第一方面，本专利技术实施例提供一种神经网络语言模型，所述神经网络语言模型包括：输入层，用于将输入的文本映射为相应的特征向量，并输入所述特征向量至隐藏层；所述隐藏层，用于基于输入的所述特征向量，调用激活函数，输出对应所述特征向量的第一隐层表达至输出层；所述输出层，用于将所述第一隐层表达进行分解，得到所述第一隐层表达分别在不同隐主题下对应的第二隐层表达；以及，分别确定每个所述第二隐层表达所对应的聚类类别，并调用所述聚类类别对应的归一化指数函数得到所述第二隐层表达对应的概率分布；其中，所述聚类类别包括头聚类及尾聚类，所述头聚类中文本分类的输出概率不同于所述尾聚类中文本分类的输出概率；以及，融合各所述第二隐层表达对应的概率分布，并基于融合后得到的概率分布输出所述文本所对应的目标文本。第二方面，本专利技术实施例提供一种基于神经网络语言模型的文本预测方法，包括：输入文本至所述神经...

【技术保护点】
1.一种基于神经网络语言模型的文本预测方法，其特征在于，包括：输入文本至所述神经网络语言模型的输入层，以将所述文本映射为相应的特征向量；通过所述神经网络语言模型的隐藏层，调用激活函数得到对应所述特征向量的第一隐层表达；通过所述神经网络语言模型的输出层，将所述第一隐层表达进行分解，得到所述第一隐层表达分别在不同隐主题下对应的第二隐层表达；分别确定每个所述第二隐层表达所对应的聚类类别，并调用所述聚类类别对应的归一化指数函数得到所述第二隐层表达对应的概率分布；其中，所述聚类类别包括头聚类及尾聚类，所述头聚类中文本分类的输出概率不同于所述尾聚类中文本分类的输出概率；融合各所述第二隐层表达对应的概率分布，并基于融合后得到的概率分布输出所述文本所对应的目标文本。

【技术特征摘要】
1.一种基于神经网络语言模型的文本预测方法，其特征在于，包括：输入文本至所述神经网络语言模型的输入层，以将所述文本映射为相应的特征向量；通过所述神经网络语言模型的隐藏层，调用激活函数得到对应所述特征向量的第一隐层表达；通过所述神经网络语言模型的输出层，将所述第一隐层表达进行分解，得到所述第一隐层表达分别在不同隐主题下对应的第二隐层表达；分别确定每个所述第二隐层表达所对应的聚类类别，并调用所述聚类类别对应的归一化指数函数得到所述第二隐层表达对应的概率分布；其中，所述聚类类别包括头聚类及尾聚类，所述头聚类中文本分类的输出概率不同于所述尾聚类中文本分类的输出概率；融合各所述第二隐层表达对应的概率分布，并基于融合后得到的概率分布输出所述文本所对应的目标文本。2.如权利要求1所述的方法，其特征在于，所述方法还包括：依据文本分类出现在训练数据中的频次，对多个文本分类进行聚类，得到至少一个所述头聚类及至少一个所述尾聚类。3.如权利要求2所述的方法，其特征在于，所述依据文本分类出现在训练数据中的频次，对多个文本分类进行聚类，包括：按照所述频次由高到低的顺序对所述多个文本分类进行排序，得到文本分类序列；遍历所述文本分类序列，并对文本分类的频次进行累加；当文本分类的累计频次满足预设条件时，停止所述遍历，并将所述文本分类序列中遍历过的所有文本分类所形成的集合作为所述头聚类。4.如权利要求3所述的方法，其特征在于，所述方法还包括：重复执行下述操作直至获得预定数量的尾聚类：遍历所述文本分类序列中剩余未遍历的文本分类序列，并对文本分类的频次进行累加；当文本分类的累计频次满足预设条件时，停止所述遍历，并将所述文本分类序列中本次遍历过的所有文本分类所形成的集合作为尾聚类。5.如权利要求4所述的方法，其特征在于，所述方法还包括：分别为每个所述尾聚类分配类标识ID；相应的，所述头聚类中还包括所述预定数量的尾聚类的类ID。6.如权利要求1所述的方法，其特征在于，所述分别确定每个所述第二隐层表达所对应的聚类类别，包括：对所述第二隐层表达应用所述头聚类对应的归一化指数函数，得到所述第二隐层表达对应的概率分布；确定所述第二隐层表达对应的概率分布的最大值所对应的文本；依据所确定的所述文本确定所述第二隐层表达所对应的聚类类别。7.如权利要求1所述的方法，其特征在于，所述方法还包括：确定训练数据的第二隐层表达所对应的聚类类别；以所述训练数据的第二隐层表达作为输入，以所述训练数据对应的目标数据作为输出，训练所述聚类类别对应的归一化指数函数根据训练数据的第二隐层表达预测相应的目标数据的性能。8.如权利要求1所述的方法，其特征在于，所述融合各...

【专利技术属性】
技术研发人员：陈强，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人