文本纠错的适配方法、装置、电子设备及存储介质制造方法及图纸

技术编号:26598853 阅读:32 留言:0更新日期:2020-12-04 21:21
本申请公开了一种文本纠错的适配方法、装置、电子设备及存储介质,其中,该方法包括:根据第一文本信息及语法纠错模型进行纠错处理,得到第二文本信息;根据第一文本信息、第一文本信息所适配的当前场景信息及适配模型进行场景适配处理,得到所述第一文本信息中的文本对象是否需要在当前场景下被修改的适配处理策略;根据所述第一文本信息、所述第二文本信息及所述适配处理策略进行整合处理,得到适配所述当前场景的目标文本信息。采用本申请,可以实现针对不同应用场景的纠错适配处理,且提高了纠错处理的准确率及纠错的处理效率。

【技术实现步骤摘要】
文本纠错的适配方法、装置、电子设备及存储介质
本申请涉及信息处理的
,尤其涉及一种文本纠错的适配方法、装置、电子设备及存储介质。
技术介绍
随着便携设备、手机终端等电子设备相比以往更智能化,芯片的解析能力更强,可以对文本信息、图文信息等进行高效的解析及信息处理。以文本信息为例,可以通过神经网络模型对文本中的拼写及语义等问题进行纠错处理,无需人工检查,既提高了纠错处理的准确率,又提高了纠错的处理效率。然而,该纠错处理不能解决针对不同应用场景情况下的兼容性及适配性,导致报错。也就是说,对于不同应用场景情况下的纠错需求,无法针对不同应用场景进行纠错适配处理,相关技术中,对如何实现纠错适配处理,未存在有效的解决方案。
技术实现思路
本申请提供了一种文本纠错的适配方法、装置、电子设备及存储介质。根据本申请的一方面,提供了一种文本纠错的适配方法,包括:根据第一文本信息及语法纠错模型进行纠错处理,得到第二文本信息;根据第一文本信息、第一文本信息所适配的当前场景信息及适配模型进行场景适配处理,得到所述第本文档来自技高网...

【技术保护点】
1.一种文本纠错的适配方法,其特征在于,/n根据第一文本信息及语法纠错模型进行纠错处理,得到第二文本信息;/n根据第一文本信息、第一文本信息所适配的当前场景信息及适配模型进行场景适配处理,得到所述第一文本信息中的文本对象是否需要在当前场景下被修改的适配处理策略;/n根据所述第一文本信息、所述第二文本信息及所述适配处理策略进行整合处理,得到适配所述当前场景的目标文本信息。/n

【技术特征摘要】
1.一种文本纠错的适配方法,其特征在于,
根据第一文本信息及语法纠错模型进行纠错处理,得到第二文本信息;
根据第一文本信息、第一文本信息所适配的当前场景信息及适配模型进行场景适配处理,得到所述第一文本信息中的文本对象是否需要在当前场景下被修改的适配处理策略;
根据所述第一文本信息、所述第二文本信息及所述适配处理策略进行整合处理,得到适配所述当前场景的目标文本信息。


2.根据权利要求1所述的方法,其特征在于,所述根据所述第一文本信息、所述第二文本信息及所述适配处理策略进行整合处理,得到适配所述当前场景的目标文本信息,包括:
获取所述适配处理策略中对应于所述第一文本信息的标识信息;
所述标识信息用于指示所述第一文本信息需要被修改的情况下,保留所述第二文本信息,并将所述第二文本信息适配为所述目标文本信息;
所述标识信息用于指示所述第一文本信息不需要被修改的情况下,保留所述第一文本信息,并将所述第一文本信息适配为所述目标文本信息。


3.根据权利要求1所述的方法,其特征在于,还包括:
响应于编辑距离操作,得到所述第一文本信息及所述第二文本信息中文本对象的相似度;
根据所述文本对象的相似度,对所述第一文本信息及所述第二文本信息执行对齐处理,确定所述第一文本信息中已被修改的文本对象。


4.根据权利要求3所述的方法,其特征在于,还包括:
将所述第一文本信息中的文本对象,与所述第一文本信息经所述适配处理策略确定要修改的所述第二文本信息中的文本对象进行比对,得到比对结果;
根据所述比对结果及所述适配处理策略得到整合处理策略,以根据所述整合处理策略进行所述整合处理。


5.根据权利要求1-4中任一项所述的方法,其特征在于,还包括:
根据所述第一文本信息、构成所述第一文本信息的多个文本对象及与所述适配处理策略对应的分类标签,得到训练样本;
根据所述训练样本进行多场景适配的模型训练,得到训练后的多场景适配模型;
将所述训练后的多场景适配模型作为所述适配模型。


6.根据权利要求5所述的方法,其特征在于,所述根据所述训练样本进行多场景适配的模型训练,得到训练后的多场景适配模型,包括:
将所述训练样本输入所述多场景适配模型,分别计算用于表征第一文本信息类型的第一损失函数,以及用于表征第一文本信息是否需要被修改的第二损失函数;
根据所述第一损失函数及所述第二损失函数,得到总损失函数;
根据所述总损失函数的反向传播训练所述多场景适配模型,得到所述训练后的多场景适配模型。


7.根据权利要求6所述的方法,其特征在于,所述将所述训练样本输入所述多场景适配模型,在所述多场景适配模型的训练过程中还包括:
将所述第一文本信息的多个文本对象向量化后,得到对应多个文本对象的多个特征向量;
将所述多个特征向量进行双向编码器Bert编码,为所述多个特征向量分别添加对应的上下文信息,得到带上下文信息的多个特征向量;
将所述带上下文信息的多个特征向量,输入前向反馈神经网络FFN进行分类处理后分别输入归一化指示函数Softmax层及激活函数sigmoid层;
经所述Softmax层运算后输出所述第一损失函数;
经所述sigmoid层运算后输出所述第二损失函数。


8.一种文本纠错的适配装置,其特征在于,所述装置包括:
纠错模块,用于根据第一文本信息及语法纠错模型进行纠错处理,得到第二文本信息;
适配模块,用于根据第一文本信息、第一文本信息所适配的当前场景信息及适配模型...

【专利技术属性】
技术研发人员:许士亭许国伟丁文彪刘子韬
申请(专利权)人:北京世纪好未来教育科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1