文本检测方法及装置制造方法及图纸

技术编号:34444249 阅读:55 留言:0更新日期:2022-08-06 16:37
本说明书提供文本检测方法及装置,其中所述文本检测方法包括:通过获取待检测文本,并确定所述待检测文本的文本类型;按照所述文本类型对应的文本转换策略对所述待检测文本进行转换处理,获得待检测文本表达;基于文本检测模型中的编码单元对所述待检测文本表达进行编码处理,获得编码向量;基于所述文本检测模型中的分类单元对所述编码向量进行异常检测,获得所述待检测文本的异常信息,从而实现对待检测文本的异常检测,提高异常检测的准确度。度。度。

【技术实现步骤摘要】
文本检测方法及装置


[0001]本说明书涉及计算机
,特别涉及一种文本检测方法。本说明书同时涉及一种文本检测装置,一种计算设备,以及一种计算机可读存储介质。

技术介绍

[0002]随着互联网技术的发展,在人们的学习生活中,越来越多的通过线上输入的方式输入待解答题目,并获取与题目对应的答案。现有技术中,当用户输入的题目为异常题目时,既无法反馈给用户正确的答案,也无法对用户输入的异常题目进行异常检测,因此亟需一种有效的方法解决上述问题。

技术实现思路

[0003]有鉴于此,本说明书实施例提供了一种文本检测方法。本说明书同时涉及一种文本检测装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
[0004]根据本说明书实施例的第一方面,提供了一种文本检测方法,包括:
[0005]获取待检测文本,并确定所述待检测文本的文本类型;
[0006]按照所述文本类型对应的文本转换策略对所述待检测文本进行转换处理,获得待检测文本表达;
[0007]基于文本检测模型中的编码单元对所述待检测文本表达进行编码处理,获得编码向量;
[0008]基于所述文本检测模型中的分类单元对所述编码向量进行异常检测,获得所述待检测文本的异常信息。
[0009]可选地,所述按照所述文本类型对应的文本转换策略对所述待检测文本进行转换处理,获得待检测文本表达,包括:
[0010]确定与所述文本类型对应的类别标识符、起始标识符和分隔标识符;
[0011]基于所述待检测文本、所述类别标识符、所述起始标识符和所述分隔标识符构建待检测文本表达。
[0012]可选地,所述基于文本检测模型中的编码单元对所述待检测文本表达进行编码处理,获得编码向量,包括:
[0013]对所述待检测文本表达进行拆分处理,获得至少两个文本组成单元;
[0014]基于文本检测模型中的编码单元对每个文本组成单元进行编码处理,获得每个文本组成单元的文本组成单元向量;
[0015]按照预设拼接策略对每个文本组成单元向量进行拼接,获得编码向量。
[0016]可选地,所述获得所述待检测文本的异常信息之后,还包括:
[0017]在所述异常信息为异常的情况下,基于所述异常信息生成异常提示信息,并将所述异常提示信息反馈至用户,或,
[0018]在所述异常信息为非异常的情况下,确定所述待检测文本对应的答案文本,并将所述答案文本反馈至用户。
[0019]可选地,所述确定与所述文本类型对应的类别标识符,包括:
[0020]基于语义识别策略确定所述文本类型对应的第一类别标识符;
[0021]或者,
[0022]基于图像识别策略确定所述文本类型对应的第二类别标识符。
[0023]可选地,所述基于语义识别策略确定所述文本类型对应的第一类别标识符,包括:
[0024]将所述待检测文本输入到语义识别模型进行处理,获得语义特征;
[0025]在所述语义特征为应用特征的情况下,确定所述待检测文本为应用题文本;
[0026]选择对应所述应用题文本的应用标识符作为第一类别标识符,其中,所述语义识别模型用于识别所述待检测文本的句式,所述语义特征用于表征句式类型。
[0027]可选地,所述文本检测方法还包括:
[0028]在所述语义特征为判断特征的情况下,确定所述待检测文本为判断题文本;
[0029]选择对应所述判断题文本的判断标识符作为第一类别标识符。
[0030]可选地,所述基于图像识别策略确定所述文本类型对应的第二类别标识符,包括:
[0031]将所述待检测文本输入到图像识别模型进行处理,获得题目元素;
[0032]在所述题目元素为选项元素的情况下,确定所述待检测文本为选择题文本;
[0033]选择对应所述选择题文本的选项标识符作为第二类别标识符,其中,所述图像识别模型用于识别所述待检测文本包含的特征元素。
[0034]可选地,所述基于图像识别策略确定所述文本类型的第二类别标识符,包括:
[0035]在所述题目元素为填空元素的情况下,确定所述待检测文本为填空题文本;
[0036]选择对应所述填空题文本的填空标识符作为第二类别标识符。
[0037]可选地,所述选项元素包括下述至少一项:字母、数字序号或符号;
[0038]相应的,所述填空元素包括下述至少一项:括号、下划线、空格。
[0039]根据本说明书实施例的第二方面,提供了一种文本检测装置,包括:
[0040]获取模块,被配置为获取待检测文本,并确定所述待检测文本的文本类型;
[0041]转换模块,被配置为按照所述文本类型对应的文本转换策略对所述待检测文本进行转换处理,获得待检测文本表达;
[0042]编码模块,被配置为基于文本检测模型中的编码单元对所述待检测文本表达进行编码处理,获得编码向量;
[0043]检测模块,被配置为基于所述文本检测模型中的分类单元对所述编码向量进行异常检测,获得所述待检测文本的异常信息。
[0044]根据本说明书实施例的第三方面,提供了一种计算设备,包括:
[0045]存储器和检测器;
[0046]所述存储器用于存储计算机可执行指令,所述检测器用于执行所述计算机可执行指令:
[0047]根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被检测器执行时实现所述文本检测方法的步骤。
[0048]本说明书一实施例中提供的文本检测方法,通过获取待检测文本,并确定待检测
文本的文本类型;按照文本类型对应的文本转换策略对待检测文本进行转换处理,获得待检测文本表达;基于文本检测模型中的编码单元对待检测文本表达进行编码处理,获得编码向量;基于文本检测模型中的分类单元对编码向量进行异常检测,获得待检测文本的异常信息,从而实现对待检测文本的异常检测,提高异常检测的准确度,根据异常信息对待检测文本进行处理,提高了对待检测文本进行处理的准确率,从而提高用户体验。
附图说明
[0049]图1是本说明书一实施例提供的一种文本检测方法的流程图;
[0050]图2是本说明书一实施例提供的一种文本检测方法的示意图;
[0051]图3是本说明书一实施例提供的一种应用于数学题目的文本检测方法的检测流程图;
[0052]图4是本说明书一实施例提供的一种文本检测装置的结构示意图;
[0053]图5是本说明书一实施例提供的一种计算设备的结构框图。
具体实施方式
[0054]在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
[0055]在本说明书一个或多本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本检测方法,其特征在于,包括:获取待检测文本,并确定所述待检测文本的文本类型;按照所述文本类型对应的文本转换策略对所述待检测文本进行转换处理,获得待检测文本表达;基于文本检测模型中的编码单元对所述待检测文本表达进行编码处理,获得编码向量;基于所述文本检测模型中的分类单元对所述编码向量进行异常检测,获得所述待检测文本的异常信息。2.根据权利要求1所述的方法,其特征在于,所述按照所述文本类型对应的文本转换策略对所述待检测文本进行转换处理,获得待检测文本表达,包括:确定与所述文本类型对应的类别标识符、起始标识符和分隔标识符;基于所述待检测文本、所述类别标识符、所述起始标识符和所述分隔标识符构建待检测文本表达。3.根据权利要求1所述的方法,其特征在于,所述基于文本检测模型中的编码单元对所述待检测文本表达进行编码处理,获得编码向量,包括:对所述待检测文本表达进行拆分处理,获得至少两个文本组成单元;基于文本检测模型中的编码单元对每个文本组成单元进行编码处理,获得每个文本组成单元的文本组成单元向量;按照预设拼接策略对每个文本组成单元向量进行拼接,获得编码向量。4.根据权利要求1所述的方法,其特征在于,所述获得所述待检测文本的异常信息之后,还包括:在所述异常信息为异常的情况下,基于所述异常信息生成异常提示信息,并将所述异常提示信息反馈至用户,或,在所述异常信息为非异常的情况下,确定所述待检测文本对应的答案文本,并将所述答案文本反馈至用户。5.根据权利要求2所述的方法,其特征在于,所述确定与所述文本类型对应的类别标识符,包括:基于语义识别策略确定所述文本类型对应的第一类别标识符;或者,基于图像识别策略确定所述文本类型对应的第二类别标识符。6.根据权利要求5所述的方法,其特征在于,所述基于语义识别策略确定所述文本类型对应的第一类别标识符,包括:将所述待检测文本输入到语义识别模型进行处理,获得语义特征;在所述语义特征为应用特征的情况下,确定所述待检测文本为应用题文本;选择对应所述应用题文本的应用标识符作为第一类别标识符...

【专利技术属性】
技术研发人员:刘洋赵薇柳景明
申请(专利权)人:北京飞象星球科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1