【技术实现步骤摘要】
语句推断方法及训练方法、装置、电子设备及存储介质
[0001]本说明书实施例涉及计算机自然语言处理
,尤其涉及一种语句推断方法及训练方法、装置、电子设备及存储介质。
技术介绍
[0002]对于语言(例如,英文、中文等)学习者而言,口头表达的语句容易出现错误,其中,错误类型可以归类为语法错误和语义不明。
[0003]当前,推断口语表达语句的错误类型主要是通过对语句进行特征提取,例如,提取句子的困惑度、语法错误说、计算输入语料与所述输入语料回译得到的句子间的对齐值等特征,用提取到的特征训练分类器,并用训练好的分类器,预测口语表达语句的错误类型。
[0004]然而,在对口语表达语句的错误类型进行预测时,需要提取多种特征,计算量大,需要占用大量系统资源进行处理。
技术实现思路
[0005]有鉴于此,本说明书实施例提供一种语句推断方法及训练方法、装置、电子设备及存储介质,在推断语句是否存在错误以及具体的错误类型时,能够降低计算量,节约系统资源。
[0006]首先,本说明书实施例提供了一种语句推断的训练丰富,包括:
[0007]分别获取目标语言类型的第一训练语料集和第二训练语料集,其中,所述第二训练语料集包括语义不明训练语料集和语法错误训练语料集;
[0008]将所述第一训练语料集和所述第二训练语料集输入至预设的第一神经网络模型,对所述第一神经网络模型进行训练,直至所述第一神经网络模型达到预设的第一停止条件,得到第一语句推断初始模型;将所述第二训练语料集输入至预设的第 ...
【技术保护点】
【技术特征摘要】
1.一种语句推断的训练方法,其特征在于,包括:分别获取目标语言类型的第一训练语料集和第二训练语料集,其中,所述第二训练语料集包括语义不明训练语料集和语法错误训练语料集;将所述第一训练语料集和所述第二训练语料集输入至预设的第一神经网络模型,对所述第一神经网络模型进行训练,直至所述第一神经网络模型达到预设的第一停止条件,得到第一语句推断初始模型;将所述第二训练语料集输入至预设的第二神经网络模型,对所述第二神经网络模型进行训练,直至所述第二神经网络模型达到预设的第二停止条件,得到第二语句推断初始模型;分别获取包含标注信息的第三训练语料集、第四训练语料集和第五训练语料集,其中:所述第三训练语料集包括正确语料;所述第四训练语料集包括语义不明语料;所述第五训练语料集包括语法错误语料;将所述第三训练语料集、所述第四训练语料集和所述第五训练语料集输入至所述第一语句推断初始模型,对所述第一语句推断初始模型进行微调,直至所述第一语句推断初始模型达到预设的第三停止条件,得到第一语句推断模型;以及将所述第四训练语料集和所述第五训练语料集输入至所述第二语句推断初始模型,对所述第二语句推断初始模型进行微调,直至所述第二语句推断初始模型达到预设的第四停止条件,得到第二语句推断模型;输出训练完成的语句推断模型,包括所述第一语句推断模型和所述第二语句推断模型。2.根据权利要求1所述的训练方法,其特征在于,所述获取第二训练语料集中的语义不明训练语料集,包括:获取第六训练语料集;将所述第六训练语料集中的源语料输入至预设的翻译模型进行翻译处理,得到所述源语料对应的目标语言类型的翻译结果;将所述源语料的各片段与其相应翻译结果的进行对齐操作,并删除所述翻译结果对齐部分内容;将对齐部分的源语料输入至所述翻译模型进行翻译,得到对应的直译结果;将所述直译结果嵌入到经删除对齐部分内容的翻译结果,得到所述语义不明训练语料集。3.根据权利要求1所述的训练方法,其特征在于,所述获取第二训练语料集中的语义不明训练语料集还包括以下至少一种方式:交换所述第一训练语料集中相应语料的词序;删除所述第一训练语料集中相应语料的部分词;以相同的概率去除所述第一训练语料集中各语料的预设位置的片段。4.根据权利要求1
‑
3任一项所述的训练方法,其特征在于,所述第一神经网络模型包括依次耦接的多个编码层和与最后一个编码层耦接的全连接层;所述对所述第一神经网络模型进行训练,直至所述第一神经网络模型达到预设的第一停止条件,得到第一语句推断初始模型,包括:将所述第一训练语料集和所述第二训练语料集依次输入至所述第一神经网络模型的多个编码层,得到对应的编码向量,并由最后一个的编码层输出所述编码向量中的第一个
编码向量至所述全连接层,得到所述编码向量对应的二维向量;计算所述二维向量与所述第一训练语料集和所述第二训练语料集的独热向量的交叉熵,并作为损失函数;对所述损失函数进行最小化,更新所述第一神经网络模型的参数,并在所述第一神经网络模型达到第一停止条件时,停止更新所述第一神经网络模型的参数,得到所述第一语句推断初始模型。5.根据权利要求4所述的训练方法,其特征在于,还包括:获取用于验证所述第一神经网络模型是否训练完成的第一验证语料集和第二验证语料集,其中,所述第一验证语料集和所述第二验证语料集中的语料为所述目标语言类型的语料;所述在所述第一神经网络模型达到第一停止条件时,停止更新所述第一神经网络模型的参数,得到所述第一语句推断初始模型,包括:将所述第一验证语料集和所述第二验证语料集连续多次输入至所述第一神经网络模型,得到所述第一验证语料集和所述第二验证语料集对应的多个二维向量;若连续预设第一次数的遍历过程得到的结果满足第一预设条件时,停止对所述第一神经网络模型进行训练,得到所述第一语句推断初始模型。6.根据权利要求4所述的训练方法,其特征在于,所述对所述第一语句推断初始模型进行微调,直至所述第一语句推断初始模型达到预设的第三停止条件,得到第一语句推断模型,包括:将所述第三训练语料集、所述第四训练语料集和所述第五训练语料集依次输入至所述第一神经网络模型的多个编码层,得到对应的编码向量,并由最后一个的编码层输出所述编码向量中的第一个编码向量至所述全连接层,得到所述编码向量对应的二维向量;计算所述二维向量与所述第三训练语料集、所述第四训练语料集和所述第五训练语料集的独热向量的交叉熵,并作为损失函数;对所述损失函数进行最小化,更新所述第一语句推断初始模型的参数,并在所述第一语句推断初始模型达到第三停止条件时,停止更新所述第一语句推断初始模型的参数,得到所述第一语句推断模型。7.根据权利要求1
‑
3任一项所述的训练方法,其特征在于,所述第二神经网络模型包括依次耦接的多个编码层和与最后一个编码层耦接的全连接层;所述对所述第二神经网络模型进行训练,直至所述第二神经网络模型达到预设的第二停止条件,得到第二语句推断初始模型,包括:将所述第二训练语料集依次输入至所述第二神经网络模型的多个编码层,得到对应的编码向量,并由最后一个的编码层输出所述编码向量中...
【专利技术属性】
技术研发人员:余勇宏,
申请(专利权)人:上海流利说信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。