System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 文本检测方法、装置、设备及存储介质制造方法及图纸_技高网

文本检测方法、装置、设备及存储介质制造方法及图纸

技术编号:40352804 阅读:7 留言:0更新日期:2024-02-09 14:37
本申请提供了一种文本检测方法、装置、设备及存储介质,属于自然语言处理技术领域。方法包括:获取待检测的文本;确定文本的文本类型,文本类型用于指示文本所属的文体;基于文本类型,从多个检测维度中确定与文本类型匹配的目标检测维度,多个检测维度用于基于不同的检测条件对文本进行检测;基于目标检测维度的目标检测条件,对文本进行检测,得到文本中的目标内容,目标内容为文本中不符合目标检测条件的文本内容。该方法基于检测条件自动对文本进行检测,提高了检测效率;且基于相应检测维度的检测条件对文本进行检测,降低了文本检测范围,提高了文本检测的针对性,进而能够提高文本检测的准确性。

【技术实现步骤摘要】

本申请涉及自然语言处理,特别涉及一种文本检测方法、装置、设备及存储介质


技术介绍

1、在文本处理领域,录入、编辑和排版等都已经有比较成熟的计算机处理方法。但文本检测这一环节仍然停留在人工处理阶段,文本检测用于检测出文本中的一些错误。而通过人工进行文本检测,费时费力,进而降低了文本检测的效率。


技术实现思路

1、本申请实施例提供了一种文本检测方法、装置、设备及存储介质,能够提高文本检测的准确性。所述技术方案如下:

2、一方面,提供了一种文本检测方法,所述方法包括:

3、获取待检测的文本;

4、确定所述文本的文本类型,所述文本类型用于指示所述文本所属的文体;

5、基于所述文本类型,从多个检测维度中确定与所述文本类型匹配的目标检测维度,所述多个检测维度用于基于不同的检测条件对文本进行检测;

6、基于所述目标检测维度的目标检测条件,对所述文本进行检测,得到所述文本中的目标内容,所述目标内容为所述文本中不符合所述目标检测条件的文本内容。

7、在一些实施例中,所述确定所述文本的文本类型,包括:

8、将所述文本输入文本分类模型,所述文本分类模型用于得到文本类型;

9、通过所述文本分类模型,提取所述文本的类型特征,基于所述类型特征,对所述文本进行分类,得到所述文本的文本类型,所述类型特征包括文本的写作风格特征、句式结构特征和内容表达特征中的至少一项。

10、在一些实施例中,所述方法还包括:

11、获取多个文本类型的多个训练文本;

12、提取所述多个训练文本的类型特征;

13、基于所述多个训练文本的类型特征和文本类型进行模型训练,得到所述文本分类模型。

14、在一些实施例中,所述方法还包括以下至少一项:

15、基于所述文本的类型特征,对所述文本进行评估,得到所述文本的分值,所述分值用于指示所述文本的文本质量;

16、对所述文本的写作风格特征、句式结构特征和内容表达特征进行评估,得到所述文本中的第一内容、第二内容和第三内容,所述第一内容为写作风格分值小于第一分值的文本内容,所述第二内容为句式结构分值小于第二分值的文本内容,所述第三内容为内容表达分值小于第三分值的文本内容。

17、在一些实施例中,所述方法还包括:

18、基于所述文本类型,从多个文本库中获取所述文本类型对应的目标文本库,每个文本库存储有文本类型相同的多个文本;

19、基于所述目标文本库中的多个文本,确定所述目标内容对应的修正文本,所述修正文本用于修正所述目标内容。

20、在一些实施例中,所述方法还包括以下至少一项:

21、基于句法条件对所述文本的句法进行检测,得到所述文本中的第四内容,所述第四内容为所述文本中不符合所述句法条件的文本内容;

22、基于语义条件对所述文本的语义进行检测,得到所述文本中的第五内容,所述第五内容为所述文本中不符合所述语义条件的文本内容;

23、基于所述文本类型,从多个文本库中获取所述文本类型对应的目标文本库,每个文本库分别存储有文本类型相同的多个文本;基于所述目标文本库中的多个文本,确定所述文本中的第六内容,所述第六内容为与所述多个文本之间的相似度大于参考相似度的文本内容。

24、在一些实施例中,所述基于所述目标文本库中的多个文本,确定所述文本中的第六内容,包括:

25、从所述多个文本中确定与所述文本语义关联的多个目标文本;

26、对所述文本中的多个文本内容分别进行特征提取,得到所述多个文本内容的文本特征;

27、将所述多个文本内容中,与任一目标文本的文本特征之间的相似度大于参考相似度的文本内容作为所述第六内容。

28、在一些实施例中,所述方法还包括:

29、将所述目标内容发送给终端,所述终端用于在所述文本中标注所述目标内容,且显示标注后的文本;或者,

30、在所述文本中标注所述目标内容,将标注后的文本发送给终端,所述终端用于显示标注后的文本。

31、在一些实施例中,所述基于所述目标检测维度的目标检测条件,对所述文本进行检测,得到所述文本中的目标内容,包括:

32、在所述文本类型为诗歌类型的情况下,基于韵律条件,对所述文本进行检测,得到所述文本中不符合所述韵律条件的目标内容;

33、在所述文本类型为通知类型的情况下,基于通知文本条件,对所述文本进行检测,得到所述文本中不符合所述通知文本条件的目标内容,所述通知文本条件包括标题子条件、受文对象子条件、正文子条件和落款子条件。

34、另一方面,提供了一种文本检测方法,所述方法包括:

35、获取待检测的文本,将所述文本发送给服务器,所述服务器用于基于所述文本的文本类型,从多个检测维度中确定与所述文本类型匹配的目标检测维度,基于所述目标检测维度的目标检测条件,对所述文本进行检测,得到所述文本中的目标内容,所述文本类型用于指示所述文本所属的文体,所述多个检测维度用于基于不同的检测条件对文本进行检测,所述目标内容为所述文本中不符合所述检测条件的文本内容;

36、接收所述服务器返回的所述目标内容,在所述文本中标注所述目标内容,且显示标注后的文本。

37、在一些实施例中,所述方法还包括:

38、显示类型选择组件,所述类型选择组件包括多个候选文本类型的选择项;响应于对任一候选文本类型的选择操作,得到所述文本的文本类型;或者,显示类型输入框,响应于在所述类型输入框中的输入操作,得到所述文本的文本类型;

39、将所述文本的文本类型发送给所述服务器。

40、在一些实施例中,所述方法还包括:

41、接收所述服务器返回的所述目标内容对应的修正文本,在所述文本中显示所述修正文本,所述修正文本用于修正所述目标内容。

42、在一些实施例中,所述方法还包括:

43、在所述文本中显示所标注的第一内容、第二内容和第三内容,所述第一内容为写作风格分值小于第一分值的文本内容,所述第二内容为句式结构分值小于第二分值的文本内容,所述第三内容为内容表达分值小于第三分值的文本内容;或者,

44、在所述文本中显示所标注的第一内容、第二内容和第三内容,以及显示所述第一内容,所述第二内容和所述第三内容各自的分值。

45、在一些实施例中,所述方法还包括:

46、显示所述文本的分值,所述分值基于所述文本的类型特征得到,用于指示所述文本的文本质量,所述类型特征包括写作风格特征、句式结构特征和内容表达特征中的至少一项。

47、在一些实施例中,所述方法还包括:

48、在所述文本中显示所标注的第四内容、第五内容和第六内容,所述第四内容为所述文本中不符合句法条件的文本内容,所述第五内容为所述文本中不符合语义本文档来自技高网...

【技术保护点】

1.一种文本检测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述确定所述文本的文本类型,包括:

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求2所述的方法,其特征在于,所述方法还包括以下至少一项:

5.根据权利要求1所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述方法还包括以下至少一项:

7.根据权利要求6所述的方法,其特征在于,所述基于所述目标文本库中的多个文本,确定所述文本中的第六内容,包括:

8.根据权利要求1所述的方法,其特征在于,所述方法还包括:

9.根据权利要求1所述的方法,其特征在于,所述基于所述目标检测维度的目标检测条件,对所述文本进行检测,得到所述文本中的目标内容,包括:

10.一种文本检测方法,其特征在于,所述方法包括:

11.根据权利要求10所述的方法,其特征在于,所述方法还包括:

12.根据权利要求10所述的方法,其特征在于,所述方法还包括:

13.根据权利要求10所述的方法,其特征在于,所述方法还包括:

14.根据权利要求10所述的方法,其特征在于,所述方法还包括:

15.根据权利要求10所述的方法,其特征在于,所述方法还包括:

16.一种文本检测装置,其特征在于,所述装置包括:

17.一种文本检测装置,其特征在于,所述装置包括:

18.一种计算机设备,其特征在于,所述计算机设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条程序代码,所述至少一条程序代码由所述一个或多个处理器加载并执行,以实现如权利要求1-9或权利要求10-15任一项所述的文本检测方法。

19.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以实现如权利要求1-9或权利要求10-15任一项所述的文本检测方法。

20.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序代码,所述计算机程序代码存储在计算机可读存储介质中,计算机设备的处理器从所述计算机可读存储介质读取所述计算机程序代码,所述处理器执行所述计算机程序代码,使得所述计算机设备执行如权利要求1-9或权利要求10-15任一项所述的文本检测方法。

...

【技术特征摘要】

1.一种文本检测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述确定所述文本的文本类型,包括:

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求2所述的方法,其特征在于,所述方法还包括以下至少一项:

5.根据权利要求1所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述方法还包括以下至少一项:

7.根据权利要求6所述的方法,其特征在于,所述基于所述目标文本库中的多个文本,确定所述文本中的第六内容,包括:

8.根据权利要求1所述的方法,其特征在于,所述方法还包括:

9.根据权利要求1所述的方法,其特征在于,所述基于所述目标检测维度的目标检测条件,对所述文本进行检测,得到所述文本中的目标内容,包括:

10.一种文本检测方法,其特征在于,所述方法包括:

11.根据权利要求10所述的方法,其特征在于,所述方法还包括:

12.根据权利要求10所述的方法,其特征在于,所述方法还包括:

13.根据权利要求10所述的方法,其特征在于,所述方法还...

【专利技术属性】
技术研发人员:罗阳俊黄赟贺
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1