一种基于循环神经网络的蒙古语语言模型制造技术

技术编号：19009126 阅读：92 留言：0更新日期：2018-09-22 09:00

本发明专利技术在原有的N‑Gram、NNLM、RNNLM语言模型的基础上提供了一种基于DNN的蒙古语声学模型。本发明专利技术在输入层引入上下文词向量和含有语义信息类别的词向量，不仅可以学习到更长距离的历史信息，同时也注入了相关的语义类别信息，有效的解决了现有的语言模型主要存在的问题。

A Mongolian language model based on recurrent neural network

The invention provides a Mongolian acoustic model based on DN N on the basis of the original N_Gram, NNLM and RNLM language models. By introducing context word vectors and word vectors containing semantic information categories into the input layer, the invention can not only learn long-distance historical information, but also inject relevant semantic category information, effectively solving the main problems existing in the existing language model.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于循环神经网络的蒙古语语言模型
本专利技术属于蒙古语语音识别领域，具体涉及一种基于循环神经网络的蒙古语语言模型。
技术介绍
语言模型被广泛应用在自然语言处理中，如语音识别、机器翻译、问答系统等应用中。语言模型是通过识别语言中允许出现词序列的先验概率进行建模，为词序列提供语法和句法约束。基于原有的N-Gram语言模型，逐步发展出NNLM、RNNLM等多种模型，缺乏对长距离信息的描述能力和缺乏语义信息的注入，是现有的语言模型主要存在的问题。
技术实现思路
由于基于循环神经网络的语言模型能更好地避免数据稀疏、长距离依赖欠佳的缺陷，因此本专利技术提供了一种基于循环神经网络的蒙古语语言模型(MLMRNN)，在输入层引入上下文词向量和含有语义信息类别的词向量，不仅可以学习到更长距离的历史信息，同时也注入了相关的语义类别信息，本专利技术的主要内容包括：1、模型构建MLMRNN模型结构包括输入层、隐含层和输出层，输入层是x(t)，隐含层是s(t)，输出层是y(t)。在t时刻，输入向量x(t)包括三部分，分别是w(t)，s(t-1)和f(t)，其中w(t)代表t时刻输入的词的one-hot词向量表示；s(t-1)为t-1时刻隐含层的输出；f(t)为t时刻Skip-Gram训练出的上下文词向量，维度远小于|V|；隐含层为s(t)；输出向量用y(t)表示，包括两部分，一部分是类别层神经元，另一部分是蒙古语词神经元，c(t)为对词汇表进行的词向量的聚类的类别层，输出向量y(t)即表示下一个词w(t+1)的概率。网络中，U、W、F为输入层与隐含层之间的权值矩阵，C为隐含层与类别层...
一种基于循环神经网络的蒙古语语言模型

【技术保护点】
1.一种基于循环神经网络的蒙古语语言模型，其特征在于：模型结构包括输入层、隐含层和输出层，输入层是x(t)，隐含层是s(t)，输出层是y(t)。在t时刻，输入向量x(t)包括三部分，分别是w(t)，s(t‑1)和f(t)，其中w(t)代表t时刻输入的词的one‑hot词向量表示；s(t‑1)为t‑1时刻隐含层的输出；f(t)为t时刻Skip‑Gram训练出的上下文词向量，维度远小于|V|；隐含层为s(t)；输出向量用y(t)表示，包括两部分，一部分是类别层神经元，另一部分是蒙古语词神经元，c(t)为对词汇表进行的词向量的聚类的类别层，输出向量y(t)即表示下一个词w(t+1)的概率，网络中，U、W、F为输入层与隐含层之间的权值矩阵，C为隐含层与类别层的权值矩阵，在输出层计算的时候先算词类的概率分布，再从所需的词类中计算特定词的概率，计算输出层的结果需要用到类别的输出结果，网络中各层输出值用表示为：x(t)＝w(t)+s(t‑1)+f(t) (1)s(t)＝f(U·w(t)+W·s(t‑1)+F·f(t)) (2...

【技术特征摘要】
1.一种基于循环神经网络的蒙古语语言模型，其特征在于：模型结构包括输入层、隐含层和输出层，输入层是x(t)，隐含层是s(t)，输出层是y(t)。在t时刻，输入向量x(t)包括三部分，分别是w(t)，s(t-1)和f(t)，其中w(t)代表t时刻输入的词的one-hot词向量表示；s(t-1)为t-1时刻隐含层的输出；f(t)为t时刻Skip-Gram训练出的上下文词向量，维度远小于|V|；隐含层为s(t)；输出向量用y(t)表示，包括两部分，一部分是类别层神经元，另一部分是蒙古语词神经元，c(t)为对词汇表进行的词向量的聚类的类别层，输出向量y(t)即表示下一...

【专利技术属性】
技术研发人员：马志强，张力，杨瑞，
申请(专利权)人：内蒙古工业大学，
类型：发明
国别省市：内蒙古,15

全部详细技术资料下载我是这个专利的主人