A multi view language recognition method based on one-way self annotation information, first by tagging model auxiliary information on the current word and word level of self annotation, probability of self annotation feature distribution of current word; then the probability distribution of self annotation features by Viterbi decoding to obtain relatively accurate characteristics, thus convert the bidirectional auxiliary information for unidirectional auxiliary information; then the one-way auxiliary information and the current word input multi view language model analysis, get the accurate meaning of current word. The auxiliary features of multi view of neural networks in the word level, thereby eliminating the negative effects caused by the information, using auxiliary information in a variety of different word level, word level introduction of auxiliary features a tree structure of the multi view language model training, and in the annotation model and language module respectively using the stable operator to adjust the different characteristics of their learning rate.
【技术实现步骤摘要】
基于单向自标注辅助信息的多视角语言识别方法
本专利技术涉及的是一种语音识别领域的技术,具体是一种基于单向自标注辅助信息的多视角语言识别方法。
技术介绍
近几年,循环神进网络(RNN)和基于记忆单元的长短时间变化神经网络(LSTM)被广泛用于语言模型。在现有的利用LSTM建模的诸多语言模型中,多视角神经网络语言模型能够在混淆度判断标准(Perplexity)上提升一定的模型性能,但是在语音识别重打分任务上并没有提升。这是因为这些模型所涉及的辅助特征向量中词层面的向量的信息是双向信息,即同时包含上下文信息,以至于在混淆度判断时引入了后文作弊信息故而提升,而在语音识别重打分(ASRrescore)任务中这些作弊信息无法被使用,因此无法提升语言识别重打分任务,同样的也无法在大规模语料的语音识别任务中起作用。
技术实现思路
本专利技术针对现有多视角语言模型的词层面的辅助信息包含后文信息,使得后文信息对预测结果产生负面影响,从而无法在语音识别重打分(ASRrescore)任务中提高效果、多视角语言模型的辅助特征的种类较为单一、词层面的辅助特征较为扁平化等等缺陷,提出一种基于单向自标注辅助信息的多视角语言识别方法,通过将多视角神经网络中的词层面的辅助特征,由包含前后文信息的状态转换为只包含前文信息,从而消除后文信息造成的负面影响,在此基础上,本专利技术还采用多种不同的词层面的辅助信息,引入具有树形结构的词层面辅助特征进行多视角语言模型训练,并且在标注模型和语言模块分别使用稳定算子来调整不同的适应各自的学习率等特点。本专利技术是通过以下技术方案实现的:本专利技术涉及一种基于单 ...
【技术保护点】
一种基于单向自标注辅助信息的多视角语言识别方法,其特征在于,首先通过标注模型对当前词和词层面的辅助信息进行自标注,得到当前词的自标注辅助特征的概率分布;然后将自标注辅助特征的概率分布通过Viterbi解码得到相对准确的辅助特征,从而将双向辅助信息转换为单向辅助信息;再将单向辅助信息和当前词一起输入多视角语言模型进行解析,得到当前词的准确语义。
【技术特征摘要】
1.一种基于单向自标注辅助信息的多视角语言识别方法,其特征在于,首先通过标注模型对当前词和词层面的辅助信息进行自标注,得到当前词的自标注辅助特征的概率分布;然后将自标注辅助特征的概率分布通过Viterbi解码得到相对准确的辅助特征,从而将双向辅助信息转换为单向辅助信息;再将单向辅助信息和当前词一起输入多视角语言模型进行解析,得到当前词的准确语义。2.根据权利要求1所述的方法,其特征是,所述的标注模型采用具有长短时间变化单元的循环神经网络,用于在保证较高准确率的情况下将同时包含前后文信息的辅助特征转化为只含有前文信息的特征。3.根据权利要求1所述的方法,其特征是,所述的短时间变化循环神经网络包含前后文信息的辅助特征将由基于最大熵的双向循环神经网络对语言模型的训练数据进行标注,特征作为训练这个模型的标注输入到标注模型的输出层。4.根据权利要求1所述的方法,其特征是,所述的Viterbi解码过程中使用的约束矩阵是根据训的已标注数据统计得到,用来保证标注模型的准确率。5.根据权利要求1所述的方法,其特征是,所述的多视角语言模型采用具有长短时...
【专利技术属性】
技术研发人员:俞凯,钱彦旻,吴越,贺天行,陈哲怀,
申请(专利权)人:上海交通大学,苏州思必驰信息科技有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。