【技术实现步骤摘要】
本专利技术属于深度学习,尤其涉及一种基于深度学习的重打分语言模型构建方法。
技术介绍
1、深度学习是机器学习的一个分支,其广泛应用于图像识别、语音识别、自然语言处理等领域,通过模拟人类大脑的神经网络结构来实现对数据的学习和分析。深度学习模型包括卷积神经网络(convolutional neural network,cnn)和循环神经网络(recurrentneural network,rnn)等,通常包含多个隐藏层,这些隐藏层可以学习到数据的抽象特征,从而实现更加准确的预测和分类。语言模型是一种用于预测和生成自然语言文本的统计模型,其主要目标是根据前面的文本内容,预测下一个单词或一段文本的概率分布。
2、现有的重打分语言模型虽然在提高语言生成的质量和流畅度方面有一定优势,但也存在如计算复杂性大,样本效率不佳以及评价指标不合理等问题。
技术实现思路
1、本专利技术的目的在于提供一种基于深度学习的重打分语言模型构建方法,可以通过以下技术方案实现:
2、本申请实施例提供了
...【技术保护点】
1.一种基于深度学习的重打分语言模型构建方法,其特征在于:包括:
2.根据权利要求1所述的一种基于深度学习的重打分语言模型构建方法,其特征在于:对所述文本数据进行清洗和预处理,包括:去除特殊字符和标点符号、分词、去除停用词、词干化和词形还原、去除数字、处理缺失值、标记化、向量化和长度归一化。
3.根据权利要求1所述的一种基于深度学习的重打分语言模型构建方法,其特征在于:所述网络结构包括输入层、嵌入层、隐藏层和输出层;设计网络结构包括:
4.根据权利要求3所述的一种基于深度学习的重打分语言模型构建方法,其特征在于:输入包括图像、文本和
...【技术特征摘要】
1.一种基于深度学习的重打分语言模型构建方法,其特征在于:包括:
2.根据权利要求1所述的一种基于深度学习的重打分语言模型构建方法,其特征在于:对所述文本数据进行清洗和预处理,包括:去除特殊字符和标点符号、分词、去除停用词、词干化和词形还原、去除数字、处理缺失值、标记化、向量化和长度归一化。
3.根据权利要求1所述的一种基于深度学习的重打分语言模型构建方法,其特征在于:所述网络结构包括输入层、嵌入层、隐藏层和输出层;设计网络结构包括:
4.根据权利要求3所述的一种基于深度学习的重打分语言模型构建方法,其特征在于:输入包括图像、文本和时间序列;输出包括分类结果、回归值和生成图像。
5.根据权利要求1所述的一种基于深度学习的重打分语言模型构建方法,其特征在于:将所述基础语言模型与所述重打分语言模型相结合,在所述基础语言模型的解码阶段插入所述重打分语言模型,通过所述重打分语言模型的输出调整候选词的概率分布。
【专利技术属性】
技术研发人员:方进锋,袁俊杰,焦忠楠,
申请(专利权)人:安徽迪科数金科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。