【技术实现步骤摘要】
基于强化学习的口语书面语转换方法、装置、设备和介质
[0001]本专利技术涉及自然语言处理
,尤其涉及一种基于强化学习的口语书面语转换方法、装置、设备和介质。
技术介绍
[0002]由于人们在说话和写作时的语言应用方式存在差异,且说话时可能存在句法和语法错误、不流利的情况,以及语音录制时携带的噪声,都会对语音识别所得的口语文本的可访问性和可读性造成影响。
[0003]因此,将口语文本转换为书面文本,对于降低文本内容理解难度十分重要。而在口语到书面的文本转换的研究中,标注数据不足、可解释性差是目前重要的研究难点。
技术实现思路
[0004]本专利技术提供一种基于强化学习的口语书面语转换方法、装置、电子设备和存储介质,用以解决现有技术中文本转换标注数据不足、可解释性差的缺陷。
[0005]本专利技术提供一种基于强化学习的口语书面语转换方法,包括:
[0006]获取口语文本;
[0007]将所述口语文本输入到转换模型中,得到所述转换模型输出的书面文本;
[0008]所述 ...
【技术保护点】
【技术特征摘要】
1.一种基于强化学习的口语书面语转换方法,其特征在于,包括:获取口语文本;将所述口语文本输入到转换模型中,得到所述转换模型输出的书面文本;所述转换模型是以样本口语文本中各分词的编辑操作为动作,以所述编辑操作执行所得的样本书面文本与所述样本口语文本之间的语义一致程度和/或所述样本书面文本的书面化程度为奖励,强化学习得到的。2.根据权利要求1所述的基于强化学习的口语书面语转换方法,其特征在于,所述转换模型的获取步骤包括:将所述样本口语文本中上一分词的编辑操作,以及所述样本口语文本分词中当前分词的语义特征,输入到策略模型中,得到所述策略模型输出的所述当前分词的编辑操作,并将所述当前分词的下一分词作为所述当前分词返回获取编辑操作,直至得到所述样本口语文本中每一分词的编辑操作;基于所述样本口语文本中每一分词的编辑操作,确定所述样本书面文本;基于所述样本书面文本与所述样本口语文本之间的语义一致程度和/或所述样本书面文本的书面化程度,确定所述奖励;基于所述奖励,对所述策略模型进行强化学习,得到所述转换模型。3.根据权利要求2所述的基于强化学习的口语书面语转换方法,其特征在于,所述基于所述样本书面文本与所述样本口语文本之间的语义一致程度和/或所述样本书面文本的书面化程度,确定所述奖励,包括:基于所述样本口语文本中每一分词的编辑操作,以及所述样本口语文本的编辑标签,确定第一奖励;基于所述第一奖励,以及所述样本书面文本与所述样本口语文本之间的语义一致程度和/或所述样本书面文本的书面化程度,确定所5述奖励。4.根据权利要求2所述的基于强化学习的口语书面语转换方法,其特征在于,所述样本口语文本中各分词的语义特征的获取步骤包括:将所述样本口语文本输入到语言模型中,得到所述语音模型输出的所述样本口语文本中各分词的语义特征;0所述语言模型是基于对预设口语文本中各分词的编辑标签进行监督分类学习训练微调得到;或者,所...
【专利技术属性】
技术研发人员:赵云龙,徐爽,徐波,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。