【技术实现步骤摘要】
文本纠错网络的训练方法以及文本纠错方法
[0001]本申请涉及互联网通信
,尤其涉及一种文本纠错网络的训练方法以及文本纠错方法。
技术介绍
[0002]人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
[0003]在相关技术中,文本纠错网络预测文本中每个位置的原始文字的最佳替换文字,并用最佳替换文字对原始文字进行替换以纠错。然而,原始文本对应的纠错结果可能仍存在问题,比如由两个相邻的最佳替换文字引起的语义不通顺问题。因此,需要提供更准确有效的文本纠错方案。
技术实现思路
[0004]为了解决上述提出的至少一个技术问题,本申请提供了一种文本 ...
【技术保护点】
【技术特征摘要】
1.一种文本纠错网络的训练方法,其特征在于,所述方法包括:获取多个样本对,每一所述样本对包括标准文本样本和混淆文本样本,每一所述样本对携带有隐变量标注;以所述混淆文本样本为输入,利用预设网络确定所述混淆文本样本对应的文本特征,所述文本特征包括所述混淆文本样本中多个文本片段各自对应的片段特征;利用所述预设网络基于所述文本特征预测隐变量,所述隐变量包括多个片段级隐变量,所述多个片段级隐变量与所述多个文本片段一一对应,所述片段级隐变量表征所述文本片段的理想替换结果的个性信息;利用所述预设网络基于所述文本特征和所述隐变量确定所述混淆文本样本对应的纠错结果;基于所述纠错结果、所述标准文本样本、所述隐变量、所述隐变量标注对所述预设网络进行训练,得到文本纠错网络。2.根据权利要求1所述的方法,其特征在于,所述利用所述预设网络基于所述文本特征预测隐变量,包括:针对每一所述文本片段对应的片段特征,利用所述预设网络基于所述片段特征预测所述文本片段的理想替换结果的读音信息,得到每一所述文本片段对应的读音信息、以及确定每一所述文本片段对应的读音信息为每一所述文本片段对应的所述片段级隐变量;利用所述预设网络基于每一所述文本片段对应的所述片段级隐变量,得到所述隐变量。3.根据权利要求1所述的方法,其特征在于,所述利用所述预设网络基于所述文本特征预测隐变量,包括:针对每一所述文本片段对应的片段特征,利用所述预设网络基于所述片段特征预测所述文本片段的被替换概率,得到每一所述文本片段对应的被替换概率、以及确定每一所述文本片段对应的被替换概率为每一所述文本片段对应的所述片段级隐变量;利用所述预设网络基于每一所述文本片段对应的所述片段级隐变量,得到所述隐变量。4.根据权利要求1
‑
3任意一项所述的方法,其特征在于,所述利用所述预设网络基于所述文本特征和所述隐变量确定所述混淆文本样本对应的纠错结果,包括:利用所述预设网络融合所述文本特征和所述隐变量,得到每一所述文本片段对应的至少一个候选替换结果、以及每一所述候选替换结果对应的替换概率;利用所述预设网络确定最大替换概率对应的候选替换结果为所述文本片段的理想替换结果、以及基于每一所述文本片段的理想替换结果得到所述纠错结果。5.根据权利要求1所述的方法,其特征在于,所述基于所述纠错结果、所述标准文本样本、所述隐变量、所述隐变量标注对所述预设网络进行训练,得到文本纠错网络,包括:根据所述纠错结果和所述标准文本样本的第一差异、所述隐变量和所述隐变量标注的第二差异,采用目标损失函数对所述预设网络进行参数更新,直至所述目标损失函数的取值满足收敛条件,以得到所述文本纠错网络。6.根据权利要求1所述的方法,其特征在于,所述预设网络包括第一网络、第二网络和第三网络;
所述以所述混淆文本样本为输入,利用预设网络确定所述混淆文本样本对应的文本特征,包括:以所述混淆文本样本为输入,利用所述第一网络确定所述文本特征;所述利用所述预设网络基于所述文本特征预测隐变量,包括:利用所述第二网络基于所述文本特征预测所述隐变量;所述利用所述预设网络基于所述文本特征和所述隐变量确定所...
【专利技术属性】
技术研发人员:彭浩源,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。