文本纠错方法、装置、电子设备和可读存储介质制造方法及图纸

技术编号:27936740 阅读:38 留言:0更新日期:2021-04-02 14:17
本申请公开了一种文本纠错方法、装置、电子设备和可读存储介质,涉及自然语言处理、深度学习技术领域。本申请在进行文本纠错时所采用的实现方案为:获取待处理文本,以及所述待处理文本的纠错类型;选取与所述纠错类型对应的目标纠错模型;使用所述目标纠错模型对所述待处理文本进行处理,将处理结果作为所述待处理文本的纠错结果。本申请能够提升文本纠错的灵活性与准确性。

【技术实现步骤摘要】
文本纠错方法、装置、电子设备和可读存储介质
本申请涉及计算机
,尤其涉及自然语言处理、深度学习
中的一种文本纠错方法、装置、电子设备和可读存储介质。
技术介绍
在纠错技术的实际应用当中,纠错类型可以包含形近/音近错误、标点符号错误、搭配错误、语法错误等多种类型。现有技术在针对不同纠错类型进行纠错时,通常采用的方式为训练一个纠错模型来实现多种纠错类型的纠错,当存在新的纠错类型时,需要重新对纠错模型进行训练,导致文本纠错的灵活性较差。
技术实现思路
本申请为解决技术问题所采用的技术方案是提供一种文本纠错方法,包括:获取待处理文本,以及所述待处理文本的纠错类型;选取与所述纠错类型对应的目标纠错模型;使用所述目标纠错模型对所述待处理文本进行处理,将处理结果作为所述待处理文本的纠错结果。本申请为解决技术问题所采用的技术方案是提供一种文本纠错装置,包括:获取单元,用于获取待处理文本,以及所述待处理文本的纠错类型;处理单元,用于选取与所述纠错类型对应的目标纠错模型;纠错单元,用于使用所述目标纠错模型对所述待处理文本进行处理,将处理结果作为所述待处理文本的纠错结果。一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述方法。一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述方法。r>一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述方法。上述申请中的一个实施例具有如下优点或有益效果:本申请能够提升文本纠错的灵活性与准确性。因为采用了在获取待处理文本的同时获取该待处理文本的纠错类型的技术手段,从而使用与纠错类型对应的纠错模型来处理待处理文本,所以实现了在满足用户不同纠错需求的前提下,提升了文本纠错的灵活性与准确性。上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是根据本申请第一实施例的示意图;图2是根据本申请第二实施例的示意图;图3是根据本申请第三实施例的示意图;图4是用来实现本申请实施例的文本纠错方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。图1是根据本申请第一实施例的示意图。如图1中所示,本实施例的文本纠错方法,具体可以包括如下步骤:S101、获取待处理文本,以及所述待处理文本的纠错类型;S102、选取与所述纠错类型对应的目标纠错模型;S103、使用所述目标纠错模型对所述待处理文本进行处理,将处理结果作为所述待处理文本的纠错结果。本实施例的文本纠错的方法,通过在获取待处理文本的同时获取该待处理文本的纠错类型,从而使用与纠错类型所对应的目标纠错模型处理待处理文本来得到纠错结果,实现了针对不同的纠错类型来调用不同的纠错模型,在能够满足用户不同纠错需求的前提下,还能够提升文本纠错的灵活性与准确性。本实施例在执行S101获取待处理文本时,可以将用户输入的文本作为待处理文本,也可以将用户输入语音的文本转换结果作为待处理文本。本实施例在执行S101获取待处理文本的同时,还可以获取待处理文本的纠错类型,所获取的纠错类型可以为一种,也可以为多种。其中,本实施例执行S101所获取的纠错类型可以包含形近/音近错误、标点符号错误、搭配错误、语法错误等中的至少一种。本实施例在执行S101获取待处理文本的纠错类型时,可以将用户输入或者用户选择的纠错类型作为待处理文本的纠错类型,也可以在对待处理文本的纠错类型进行识别之后,将识别结果作为待处理文本的纠错类型。可以理解的是,本实施例可以使用预先训练得到的识别模型来实现对待处理文本中纠错类型的识别,该识别模型能够根据所输入的文本,输出该文本的纠错类型。本实施例在执行S101获取了待处理文本以及待处理文本的纠错类型之后,执行S102选取与所获取的纠错类型对应的目标纠错模型。其中,本实施例选取的目标纠错模型是预先设置的,每个目标纠错模型对应于一种纠错类型,不同的目标纠错模型仅对文本中相应的一种错误进行纠正。本实施例在执行S102选取与所获取的纠错类型对应的目标纠错模型时,可以采用的可选实现方式为:根据预设的类型-模型对应关系表,将与所获取的纠错类型对应的纠错模型作为目标纠错模型。可以理解的是,本实施例执行S102所选取的目标纠错模型的数量与执行S101获取的待处理文本的纠错类型的数量相同,若纠错类型为一种,则本实施例会选取一个目标纠错模型,若纠错类型为多种,则本实施例会选取多个目标纠错模型,每个目标纠错模型对应不同的纠错类型。若本实施例在执行S102时确定同一种纠错类型对应于多个纠错模型,则可以从多个纠错模型中随机选取一个,作为该纠错类型对应的目标纠错模型。由于不同的文本还会与不同的场景相对应,因此在对不同场景下的文本进行纠错时,文本的纠错结果还会与文本对应的场景相关。为了能够提升所选取的目标纠错模型的准确性,本实施例在执行S102选取与所获取的纠错类型对应的目标纠错模型时,可以采用的可选实现方式为:获取待处理文本的场景信息,所获取的场景信息可以为聊天场景、法律场景、科技场景、医疗场景等;根据纠错类型与所获取的场景信息选取目标纠错模型。本实施例在执行S102获取待处理文本的场景信息时,可以将用户输入的场景信息作为待处理文本的场景信息,也可以对待处理文本进行场景识别,将识别结果作为待处理文本的场景信息。本实施例在执行S102根据纠错类型与所获取的场景信息选取目标纠错模型时,可以采用的可选实现方式为:将与纠错类型对应的纠错模型作为候选纠错模型;从候选纠错模型中选取与所获取的场景信息对应的纠错模型,作为目标纠错模型。也就是说,本实施例选取的目标纠错模型除了对应不同的纠错类型之外,还会与不同的场景信息相对应,根据待处理文本的一个纠错类型与一个场景信息,能够确定唯一一个目标纠错模型,因此本实施例通过结合纠错类型与场景信息的方式,能够更加准确地选取目标纠错模型,从而进一步提升所得到的纠错结果的准确性。另外,若本实施例执行S102未能够选取与纠错类型对应的目标纠错模型,则向用户返回无法完成纠错的提示信息,并在之后添加与该纠错类型对应的纠错模型。本实施例在执行S102选取了目标纠错模型之后,执行S103使用所选取的目标纠错模型对待处理文本进行处理,从而将处理结果作为待处理文本的纠错结果。本文档来自技高网...

【技术保护点】
1.一种文本纠错方法,包括:/n获取待处理文本,以及所述待处理文本的纠错类型;/n选取与所述纠错类型对应的目标纠错模型;/n使用所述目标纠错模型对所述待处理文本进行处理,将处理结果作为所述待处理文本的纠错结果。/n

【技术特征摘要】
1.一种文本纠错方法,包括:
获取待处理文本,以及所述待处理文本的纠错类型;
选取与所述纠错类型对应的目标纠错模型;
使用所述目标纠错模型对所述待处理文本进行处理,将处理结果作为所述待处理文本的纠错结果。


2.根据权利要求1所述的方法,其中,所述选取与所述纠错类型对应的目标纠错模型包括:
获取所述待处理文本的场景信息;
根据所述纠错类型与所述场景信息选取目标纠错模型。


3.根据权利要求2所述的方法,其中,所述根据所述纠错类型与所述场景信息选取目标纠错模型包括:
将与所述纠错类型对应的纠错模型作为候选纠错模型;
从所述候选纠错模型中选取与所述场景信息对应的纠错模型,作为所述目标纠错模型。


4.根据权利要求1所述的方法,其中,所述使用所述目标纠错模型对所述待处理文本进行处理包括:
确定多个目标纠错模型的纠错顺序;
按照所述纠错顺序,依次使用各纠错模型对所述待处理文本进行处理。


5.根据权利要求4所述的方法,其中,所述确定多个目标纠错模型的纠错顺序包括:
将所述纠错类型的输入顺序作为所述多个目标纠错模型的纠错顺序;或者
根据预设的模型优先级来确定多个目标纠错模型的纠错顺序。


6.一种文本纠错装置,包括:
获取单元,用于获取待处理文本,以及所述待处理文本的纠错类型;
处理单元,用于选取与所述纠错类型对应的目标纠错模型;
纠错单元,用于使用所述目标纠错模型对所述待处理文本进行处理,将处理结果作为所述待处理文本的纠错结果。


7.根据权利要求6所述的装置,其中,所述处理单元...

【专利技术属性】
技术研发人员:赖佳伟邓卓彬徐梦笛付志宏何径舟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1