【技术实现步骤摘要】
本申请涉及数据处理,尤其涉及一种用于文本纠错任务模型的生成方法、装置、设备及介质。
技术介绍
1、目前,中文文本纠错是一个很重要的角色,如果输入有误,会影响到对上下文的理解,影响任何下游任务的性能。由于深度学习技术的发展,自然语言处理的发展得到了突飞猛进,在中文文本纠错任务中,也取得了不错的进展,但是,在落地实践仍然存在以下问题:中文文本纠错任务主要分为两个子任务,一个是中文拼写纠错,一个是语法纠错,两个任务大多是独立发展,并未统一;当用户输入一个句子时,外界无法提前知道该句子中是何种错误类型,因此或者采用串联的形式,先过一遍拼写纠错,再过一遍语法纠错,但是串联的形式不仅时间成本高,还可能前后互相有影响;中文文本纠错任务中,除了拼写错误和语法错误外,还有一个常见的标点错误,目前对标点错误的问题,也尚未有相关的工作解决。
2、因此,如何在中文文本纠错场景中提高模型的训练精度,以提高模型使用的准确性成为亟待解决的问题。
技术实现思路
1、有鉴于此,本申请实施例提供了一种用于文本纠错
...【技术保护点】
1.一种用于文本纠错任务模型的生成方法,其特征在于,包括:
2.根据权利要求1所述的用于文本纠错任务模型的生成方法,其特征在于,所述纠错标注包括纠错目标结果和错误类型,所述使用所述原始中文文本及对应的纠错标注,对预设的文本纠错任务模型进行训练,得到初始训练好的文本纠错任务模型,包括:
3.根据权利要求2所述的用于文本纠错任务模型的生成方法,其特征在于,所述使用所述目标中文文本及对应的纠错标注,对所述初始训练好的文本纠错任务模型进行训练,得到二次训练好的文本纠错任务模型,包括:
4.根据权利要求1所述的用于文本纠错任务模型的生成方法,
...【技术特征摘要】
1.一种用于文本纠错任务模型的生成方法,其特征在于,包括:
2.根据权利要求1所述的用于文本纠错任务模型的生成方法,其特征在于,所述纠错标注包括纠错目标结果和错误类型,所述使用所述原始中文文本及对应的纠错标注,对预设的文本纠错任务模型进行训练,得到初始训练好的文本纠错任务模型,包括:
3.根据权利要求2所述的用于文本纠错任务模型的生成方法,其特征在于,所述使用所述目标中文文本及对应的纠错标注,对所述初始训练好的文本纠错任务模型进行训练,得到二次训练好的文本纠错任务模型,包括:
4.根据权利要求1所述的用于文本纠错任务模型的生成方法,其特征在于,所述从所述数据集中筛选出目标中文文本及对应的纠错标注,包括:
5.根据权利要求1至4任一项所述的用于文本纠错任务模型的生成方法,其特征在于,在所述从预设的数据集中获取原始中文...
【专利技术属性】
技术研发人员:邢玲,余晓填,肖嵘,
申请(专利权)人:深圳云天励飞技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。