【技术实现步骤摘要】
本申请涉及数据处理,尤其涉及一种文本纠错方法、装置、设备及介质。
技术介绍
1、文本纠错是一种对语句自动检查、自动纠正的技术。其中,在现有技术中,一般通过文本纠错模型实现文本纠错,具体的,将可能带有错误的句子输入到文本纠错模型中,该文本纠错模型会输出正确的句子。
2、目前传统的文本纠错方法,通过预置混淆词语、专有名词等方法,实现了对语音识别的文本进行特定易错词的纠错。但是,由于不同用户之间存在发音差异,经常会出现过纠、错纠的现象。例如用户a表述“经济”时,语音识别成“警戒”,进行文本纠错后将“警戒”的文本纠错为“经济”,但是用户b由于口音与用户a不同,该用户b被识别为“警戒”发音的原始表述为“京剧”,但是在文本纠错时,也会将“警戒”纠错为“经济”,导致文本纠错效果差。
技术实现思路
1、本申请提供了一种文本纠错方法、装置、设备及介质,用以解决现有技术中在对文本纠错时,受用户发音的影响,导致文本纠错效果差的问题。
2、第一方面,本申请实施例提供了一种文本纠错方法,所述
<本文档来自技高网...【技术保护点】
1.一种文本纠错方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述将所述第一文本输入到通过所述目标纠错词库训练的第一文本纠错模型中之前,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,所述第一文本纠错模型确定所述第一候选文本的过程包括:
4.根据权利要求1所述的方法,其特征在于,所述获取待纠错的第一文本及所述第一文本对应的目标用户ID之后,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,根据所述第一置信度、所述第二置信度、所述置信度阈值、所述第一候选文本及所述第二候选
...【技术特征摘要】
1.一种文本纠错方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述将所述第一文本输入到通过所述目标纠错词库训练的第一文本纠错模型中之前,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,所述第一文本纠错模型确定所述第一候选文本的过程包括:
4.根据权利要求1所述的方法,其特征在于,所述获取待纠错的第一文本及所述第一文本对应的目标用户id之后,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,根据所述第一置信度、所述第二置信度、所述置信度阈值、所述第一候选文本及所述第二候选文本,确定所述第二文本包括:
6.根据权利要求4所述的方法,其特征在于,若所述通用纠错词库中不...
【专利技术属性】
技术研发人员:孟卫明,王彦芳,王月岭,高雪松,陈维强,
申请(专利权)人:海信集团控股股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。