【技术实现步骤摘要】
文本纠错方法及装置、存储介质及电子设备
[0001]本申请涉及文本处理
,具体涉及一种文本纠错方法及装置、存储介质及电子设备。
技术介绍
[0002]随着社会科技的进步以及深度学习技术的不断发展,计算机上各式各样基于深度学习任务的技术层出不穷。利用深度学习技术辅助人们修订文章,其方便、高效的特性大大提升了文章的修正效率。
[0003]相关技术中,一般是使用端到端神经网络模型来进行文本纠错,端到端神经网络模型的训练样本通常是人为生成的,故此种模型的准确性受人主观因素的影响,与此带来的是文本纠错结果不够准确的问题。
技术实现思路
[0004]为了解决上述技术问题,提出了本申请。本申请实施例提供了一种文本纠错方法及装置、存储介质及电子设备。
[0005]第一方面,本申请一实施例提供了一种文本纠错方法,应用于基于对抗生成网络的文本纠错系统,该方法包括:利用错误检测模型,判断待纠错文本是否有误;若待纠错文本有误,利用错误修正模型,确定待纠错文本对应的修正文本,错误检测模型由对抗生成网络中的判别器训 ...
【技术保护点】
【技术特征摘要】
1.一种文本纠错方法,其特征在于,应用于基于对抗生成网络的文本纠错系统,所述方法包括:利用错误检测模型,判断待纠错文本是否有误;若所述待纠错文本有误,利用错误修正模型,确定所述待纠错文本对应的修正文本,其中,所述错误检测模型由所述对抗生成网络中的判别器训练得到,所述错误修正模型由所述对抗生成网络中的生成器训练得到。2.根据权利要求1所述的文本纠错方法,其特征在于,所述利用错误检测模型,判断待纠错文本是否有误,包括:对所述待纠错文本进行划分,得到所述待纠错文本对应的M个分句,M为正整数;将所述M个分句输入所述错误检测模型,得到所述M个分句各自对应的检测结果;基于所述M个分句各自对应的检测结果,分别判断所述M个分句是否有误;其中,所述若所述待纠错文本有误,利用错误修正模型,确定所述待纠错文本对应的修正文本,包括:若所述M个分句中的N个分句有误,利用所述错误修正模型,分别确定所述N个分句各自对应的修正语句,N为小于或等于M的正整数;基于所述M个分句之间的顺序信息,将所述N个分句各自对应的修正语句与所述M个分句中的无误分句重组,生成所述修正文本。3.根据权利要求2所述的文本纠错方法,其特征在于,所述待纠错文本包括待纠错汉语文本,所述利用所述错误修正模型,分别确定所述N个分句各自对应的修正语句,包括:针对所述N个分句中的每个分句,确定所述分句中的汉字各自对应的字特征向量;利用所述错误修正模型,基于所述分句中的汉字各自对应的字特征向量和所述分句的语义信息,确定所述分句中的汉字各自对应的至少一个扩展词;利用所述错误修正模型,基于所述分句中的汉字各自对应的至少一个扩展词,确定所述分句中的汉字各自对应的修正结果;利用所述错误修正模型,基于所述分句中的汉字各自对应的修正结果,确定所述分句对应的修正语句。4.根据权利要求3所述的文本纠错方法,其特征在于,所述基于所述分句中的汉字各自对应的字特征向量和所述分句的语义信息,确定所述分句中的汉字各自对应的至少一个扩展词,包括:针对所述分句中的每个汉字,基于所述分句的语义信息和所述汉字对应的字特征向量,确定所述汉字对应的P个候选扩展词和所述P个候选扩展词各自对应的使用概率数据,P为正整数;基于预设使用概率阈值和所述P个候选扩展词各自对应的使用概率数据,从所述P个候选扩展词中选出所述汉字对应的所述至少一个扩展词。5.根据权利要求3或4所述的文本纠错方法,其特征在于,所述基于所述分句中的汉字各自对应的至少一个扩展词,确定所述分句中的汉字各自对应的修正结果,包括:针...
【专利技术属性】
技术研发人员:杨子清,林旻,崔一鸣,伍大勇,陈志刚,
申请(专利权)人:河北省讯飞人工智能研究院科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。