【技术实现步骤摘要】
文本处理方法、装置、电子设备和可读存储介质
[0001]本申请涉及计算机
,特别是涉及一种文本处理方法、装置、电子设备和可读存储介质。
技术介绍
[0002]目前,用户在通过计算机等电子设备输入文本时,电子设备往往可以针对用户输入的文本进行纠错,即检查、标记或者更正该文本中的错误。
[0003]在相关技术中,相关技术会通过模型实现对文本的纠错,但是,模型处理文本的维度相对单一,即模型无法全面的检测文本中出现的多种类型的错误。
技术实现思路
[0004]有鉴于此,本申请实施例提供一种文本处理方法、装置、电子设备和可读存储介质,以从多个维度对目标文本进行纠错,实现对目标文本的全面纠错。
[0005]第一方面,提供了一种文本处理方法,所述方法包括:
[0006]获取目标文本。
[0007]对所述目标文本进行文本规则检测,确定规则检测结果。
[0008]将所述目标文本输入文本检测模型,确定模型检测结果。
[0009]根据所述规则检测结果和所述模型检测结果,对所述目 ...
【技术保护点】
【技术特征摘要】
1.一种文本处理方法,其特征在于,所述方法包括:获取目标文本;对所述目标文本进行文本规则检测,确定规则检测结果;将所述目标文本输入文本检测模型,确定模型检测结果;以及根据所述规则检测结果和所述模型检测结果,对所述目标文本进行纠错处理,确定所述目标文本对应的纠错文本。2.根据权利要求1所述的方法,其特征在于,所述规则检测结果包括重复字段检测结果;所述对所述目标文本进行文本规则检测,确定规则检测结果包括:根据预先设置的重复字段检测规则,对所述目标文本进行重复字段检测,以确定重复字段检测结果。3.根据权利要求1所述的方法,其特征在于,所述规则检测结果包括常见词检测结果;所述对所述目标文本进行文本规则检测,确定规则检测结果包括:根据预先设置的常见词词表对所述目标文本进行常见词检测,标记所述目标文本中的非常见词,以确定常见词检测结果。4.根据权利要求1所述的方法,其特征在于,所述根据所述规则检测结果和所述模型检测结果,对所述目标文本进行纠错处理,确定所述目标文本对应的纠错文本包括:根据所述规则检测结果和所述模型检测结果,确定至少一个纠错类型标签;根据各所述纠错类型标签分别对应的纠错规则,确定各所述纠错类型标签分别对应的纠错候选集,所述纠错候选集中包括用于更正所述目标文本的候选字或候选词;以及根据各所述纠错候选集对所述目标文本进行纠错处理,确定所述目标文本对应的纠错文本。5.根据权利要求4所述的方法,其特征在于,所述根据各所述纠错候选集对所述目标文本进行纠错处理,确定所述目标文本对应的纠错文本包括:根据预先设置的语言模型和各所述纠错候选集,对所述目标文本进行模拟纠错,以确定各所述纠错候选集中...
【专利技术属性】
技术研发人员:王亭,李志飞,
申请(专利权)人:上海墨百意信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。