数据质量检验方法、装置、电子设备及存储介质制造方法及图纸

技术编号:29980592 阅读:21 留言:0更新日期:2021-09-08 10:13
本申请提供一种数据质量校验方法、装置、电子设备及存储介质,包括:接收待审核文本,待审核文本为对测试文本的校对结果文本,测试文本中设置有预设数量的待校对信息;在确定待审核文本中与测试文本的内容不同的目标位置的第一数量大于等于预设数量时,才确定待审核文本合格,考虑到工作人员在校对测试文本中预先设置的待校对信息的过程中,也会对测试文本中的其他错误内容进行解决,其中,待审核文本中与测试文本的内容不同的目标位置的第一数量越多,待审核文本中剩余的错误内容越少,因此,在确定第一数量大于等于预设数量时,才确定待审核文本合格,保证被确定为合格的文本的质量较高,上述过程无需人工审核,审核效率高,审核成本低。成本低。成本低。

【技术实现步骤摘要】
数据质量检验方法、装置、电子设备及存储介质


[0001]本申请涉及数据处理
,具体而言,涉及一种数据质量检验方法、装置、电子设备及存储介质。

技术介绍

[0002]在相关技术中,校对人员在校对文本内容时,容易出现漏检、错检的问题,例如对试题的校对过程中,出现遗漏和失误。此时,审核人员对校对人员校对之后的文本需要进行一一审核,这就会极大地增加人工审核成本,且效率低;若审核人员只做抽审,又可能会导致漏审,无法保证文本质量。

技术实现思路

[0003]鉴于此,本申请实施例的目的在于提供一种数据质量检验方法、装置、电子设备及存储介质,以解决上述问题。
[0004]第一方面,本申请实施例提供一种数据质量检验方法,所述方法包括:接收待审核文本,所述待审核文本为对测试文本的校对结果文本,所述测试文本中设置有预设数量的待校对信息;确定所述待审核文本中与所述测试文本的内容不同的目标位置的第一数量;在确定所述第一数量大于等于所述预设数量时,确定所述待审核文本合格。
[0005]在上述实现过程中,本申请考虑到工作人员在校对测试文本中预先设置的待校对信息的过程中,也会对测试文本中的其他错误内容进行解决,可以理解的是,待审核文本中与测试文本的内容不同的目标位置的第一数量越多,则说明工作人员校对的错误内容越多,待审核文本中剩余的错误内容越少,因此,通过在测试文本中设置预设数量的待校对信息,并在确定待审核文本中与测试文本的内容不同的目标位置的第一数量大于等于预设数量时,才确定待审核文本合格,保证被确定为合格的文本质量较高,上述过程无需人工审核,审核效率高,且无需人工审核成本。
[0006]基于第一方面,在一种可能的设计中,在确定所述第一数量大于等于所述预设数量时,确定所述待审核文本合格,包括:在确定所述第一数量大于等于所述预设数量时,确定所述待校对信息在所述测试文本中的位置与所述目标位置相同的第二数量;在确定所述第二数量与所述预设数量的比值大于等于第一预设阈值时,确定所述待审核文本合格。
[0007]在上述实现过程中,本申请考虑到第二数量与预设数量的比值越大,待审核文本中剩余的待校对信息数量越少,继而可以确定待审核文本中剩余的错误内容越少,因此,在确定第二数量与预设数量的比值大于等于第一预设阈值时,才确定待审核文本合格,保证被确定为合格的文本的质量。
[0008]基于第一方面,在一种可能的设计中,在确定所述第一数量大于等于所述预设数量时,确定所述待审核文本合格,包括:在确定所述第一数量大于等于所述预设数量时,确定所述待审核文本中的所述待校对信息的剩余数量;在确定所述剩余数量与所述预设数量的比值小于等于第二预设阈值时,确定所述待审核文本合格。
[0009]在上述实现过程中,通过确定剩余数量和预设数量的比值,可以理解的是,比值越小,表征待审核文本中存在错误内容的可能性越小,反之,存在错误内容的可能性越大,因此,通过在确定比值小于等于第二预设阈值时,才确定待审核文本合格,继而保证后续被确定为合格的文本的质量。
[0010]基于第一方面,在一种可能的设计中,在确定所述第一数量大于等于所述预设数量时,确定所述待审核文本中的所述待校对信息的剩余数量,包括:在确定所述第一数量大于等于所述预设数量时,基于预先确定的所述测试文本中的所述待校对信息,确定所述剩余数量。
[0011]在上述实现过程中,在上述实现过程中,若审核文本中存在与测试文本中的待校对信息相同的待校对信息,则认为审核文本中存在待校对信息,相同的待校对信息越多,剩余数量则越大,继而可以根据预先确定的测试文本中的待校对信息,准确地确定出待审核文本中的待校对信息的剩余数量。
[0012]基于第一方面,在一种可能的设计中,在确定所述第一数量大于等于所述预设数量时,确定所述待审核文本中的所述待校对信息的剩余数量,包括:在确定所述第一数量大于等于所述预设数量时,基于预先确定的所述测试文本中的所述待校对信息的位置,比较所述测试文本和所述待审核文本中与所述位置对应的内容;根据比较结果,确定出所述剩余数量。
[0013]在上述实现过程中,基于预先确定的测试文本中的待校对信息的位置,比较测试文本和待审核文本中与该位置对应的内容,可以理解的是,若比较结果表征测试文本和待审核文本中与该位置对应的内容相同,则表征待审核文本中与该位置对应的内容为待校对信息,反之,则表征待审核文本中与该位置对应的内容不为待校对信息,因此,可以根据比较结果,准确地确定出剩余数量。
[0014]基于第一方面,在一种可能的设计中,所述方法还包括:在确定所述剩余数量与所述预设数量的比值小于等于第二预设阈值时,若确定所述剩余数量不为零,则对所述待审核文本中的待校对信息进行校对。
[0015]在上述实现过程中,在确定剩余数量与预设数量的比值小于等于第二预设阈值时,表征待审核文本为合格的文本,此时,若确定待审核文本中的待校对信息的剩余数量不为零,则对待审核文本中的待校对信息进行校对,继而保证待审核文本中不存在待校对信息,从而进一步保证被确定为合格的文本的质量。
[0016]基于第一方面,在一种可能的设计中,所述接收待审核文本包括:获取初始文本;对所述初始文本进行干扰处理,得到所述测试文本;将所述测试文本发送给校对设备;接收所述校对设备基于所述测试文本返回的所述待审核文本。
[0017]在上述实现过程中,通过对初始文本进行干扰处理,以保证测试文本中包括待校对信息,继而保证后续能根据待校对设备基于测试文本返回的待审核文本,准确地确定待审核文本的质量。
[0018]基于第一方面,在一种可能的设计中,所述对所述初始文本进行干扰处理,得到所述测试文本,包括:在所述初始文本中设置预先确定的干扰信息,得到所述测试文本;其中,所述干扰信息为所述测试文本中的待校对信息。
[0019]在上述实现过程中,由于测试文本中的干扰信息是预先确定的,继而保证后续能
准确地确定出待审核文本中的待校对信息的剩余数量。
[0020]第二方面,本申请实施例提供一种数据质量检验装置,所述装置包括:文本接收单元,用于接收待审核文本,所述待审核文本为对测试文本的校对结果文本,所述测试文本中设置有待校对信息;数量确定单元,用于确定所述待审核文本中与所述测试文本的内容不同的目标位置的第一数量;结果确定单元,用于在确定所述第一数量大于等于所述预设数量时,确定所述待审核文本合格。
[0021]基于第二方面,在一种可能的设计中,所述结果确定单元,具体用于在确定所述第一数量大于等于所述预设数量时,确定所述待校对信息在所述测试文本中的位置与所述目标位置相同的第二数量;以及在确定所述第二数量与所述预设数量的比值大于等于第一预设阈值时,确定所述待审核文本合格。
[0022]基于第二方面,在一种可能的设计中,所述结果确定单元,包括:剩余数量确定单元,用于在确定所述第一数量大于等于所述预设数量时,确定所述待审核文本中的所述待校对信息的剩余数量;结果确定子单元,用于在确定所述剩本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据质量检验方法,其特征在于,所述方法包括:接收待审核文本,所述待审核文本为对测试文本的校对结果文本,所述测试文本中设置有预设数量的待校对信息;确定所述待审核文本中与所述测试文本的内容不同的目标位置的第一数量;在确定所述第一数量大于等于所述预设数量时,确定所述待审核文本合格。2.根据权利要求1所述的方法,其特征在于,在确定所述第一数量大于等于所述预设数量时,确定所述待审核文本合格,包括:在确定所述第一数量大于等于所述预设数量时,确定所述待校对信息在所述测试文本中的位置与所述目标位置相同的第二数量;在确定所述第二数量与所述预设数量的比值大于等于第一预设阈值时,确定所述待审核文本合格。3.根据权利要求1所述的方法,其特征在于,在确定所述第一数量大于等于所述预设数量时,确定所述待审核文本合格,包括:在确定所述第一数量大于等于所述预设数量时,确定所述待审核文本中的所述待校对信息的剩余数量;在确定所述剩余数量与所述预设数量的比值小于等于第二预设阈值时,确定所述待审核文本合格。4.根据权利要求3所述的方法,其特征在于,在确定所述第一数量大于等于所述预设数量时,确定所述待审核文本中的所述待校对信息的剩余数量,包括:在确定所述第一数量大于等于所述预设数量时,基于预先确定的所述测试文本中的所述待校对信息,确定所述剩余数量。5.根据权利要求3所述的方法,其特征在于,在确定所述第一数量大于等于所述预设数量时,确定所述待审核文本中的所述待校对信息的剩余数量,包括:在确定所述第一数量大于等于所述预设数量时,基于预先确定的所述测试文本中的所述待校对信息的位置,比较所述测试文本和所述待审核文本...

【专利技术属性】
技术研发人员:孙中科徐健
申请(专利权)人:北京乐学帮网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1