一种试题信息的提取方法、装置、电子设备和存储介质制造方法及图纸

技术编号:38848613 阅读:23 留言:0更新日期:2023-09-17 09:58
本公开提供一种试题信息的提取方法、装置、电子设备和存储介质,所述方法包括:确定带插图试题的初始试题类型、初始插图类型和插图图像;基于所述初始试题类型、所述初始插图类型和所述插图图像,获得试题特征信息,所述试题特征信息至少包括插图特征信息;基于所述插图特征信息获得试题信息。当基于本公开示例性实施例方法确定待搜索插图试题的试题信息;并基于待搜索试题信息从试题库获取推荐试题时,可以高效的进行试题筛选,提升试题搜索的准确性,从而为用户精准的进行试题推荐。从而为用户精准的进行试题推荐。从而为用户精准的进行试题推荐。

【技术实现步骤摘要】
一种试题信息的提取方法、装置、电子设备和存储介质


[0001]本公开涉及计算机
,尤其涉及一种试题信息的提取方法、装置、电子设备和存储介质。

技术介绍

[0002]近年来,伴随着互联网教育的发展,越来越多的用户使用试题库搜索试题获得试题的解题思路或答案,最常用的方法就是拍照搜题。
[0003]相关技术中,用户上传一张试题图像,答疑系统获取试题图像,并推送与用户上传试题最相似的多道试题的题干、试题答案以及试题解析,供用户参考;并对于含有插图的试题,引入以图搜图的技术进行试题图像获取。

技术实现思路

[0004]根据本公开的一方面,提供了一种试题信息的提取方法,包括:
[0005]确定带插图试题的初始试题类型、初始插图类型和插图图像;
[0006]基于所述初始试题类型、所述初始插图类型和所述插图图像,获得试题特征信息,所述试题特征信息至少包括插图特征信息;
[0007]基于所述插图特征信息获得试题信息。
[0008]根据本公开的另一方面,提供了一种试题推荐方法,包括:
[0009]基于本公开示例性实施例所述方法确定待搜索插图试题的试题信息;
[0010]基于所述待搜索试题信息从试题库获取推荐试题。
[0011]根据本公开的另一方面,提供了一种试题信息的提取装置,包括:
[0012]确定模块,用于确定带插图试题的初始试题类型、初始插图类型和插图图像;
[0013]获得模块,用于基于所述初始试题类型、所述初始插图类型和所述插图图像,获得试题特征信息,所述试题特征信息至少包括插图特征信息;
[0014]所述获得模块还用于基于所述插图特征信息获得试题信息。
[0015]根据本公开的另一方面,提供了一种试题推荐装置,包括:
[0016]确定模块,基于本公开示例性实施例所述方法确定待搜索插图试题的试题信息;
[0017]获取模块,用于基于所述待搜索试题信息从试题库获取推荐试题。
[0018]根据本公开的另一方面,提供了一种电子设备,包括:
[0019]处理器;以及,存储程序的存储器;
[0020]其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据本公开示例性实施例所述的方法。
[0021]根据本公开的另一方面,提供了一种非瞬时计算机可读存储介质,所述非瞬时计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行根据本公开示例性实施例所述的方法。
[0022]本公开示例性实施例中提供的一个或多个技术方案,可以从带插图试题获取插图
图像,并基于初始试题类型、初始插图类型和插图图像,获得至少包括插图特征信息的试题特征信息,因此,插图特征信息不仅含有插图图像的相关特征,还融合有初始试题类型、初始插图类型,从而更加精准的对插图图像进行分析,避免带插图试题中其他因素的干扰,接着基于插图特征信息获得试题信息。可见,本公开示例性实施例可以将插图图像从带插图试题中剥离出来,不仅可以对带插图图像进行整体分析,还可以单独对插图图像进行分析,通过二者互相结合分析,既可以避免插图试题图像中除插图以外其他文字信息的干扰,提升插图试题搜索能力,还提升了试题信息提取的准确性。基于此,当基于本公开示例性实施例方法确定待搜索插图试题的试题信息;并基于待搜索试题信息从试题库获取推荐试题时,可以高效的进行试题筛选,提升试题搜索的准确性,从而为用户精准的进行试题推荐。
附图说明
[0023]此处所说明的附图用来提供对本公开的进一步理解,构成本公开的一部分,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。在附图中:
[0024]图1示出了根据本公开示例性实施例的可以在其中实施本文描述的各种方法的示例系统的示意图;
[0025]图2示出了本公开示例性实施例的试题信息的提取方法流程示意图;
[0026]图3示出了本公开示例性实施例的文本识别模型的文本识别流程示意图;
[0027]图4示出了本公开示例性实施例的试题推荐方法流程示意图;
[0028]图5示出了本公开示例性实施例的试题相似度确定方法的流程示意图;
[0029]图6示出了根据本公开示例性实施例的试题信息的提取装置的功能模块示意性框图;
[0030]图7示出了根据本公开示例性实施例的试题推荐装置的功能模块示意性框图;
[0031]图8示出了根据本公开示例性实施例的芯片的示意性框图;
[0032]图9示出了能够用于实现本公开的实施例的示例性电子设备的结构框图。
具体实施方式
[0033]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0034]应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
[0035]本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
[0036]需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
[0037]本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
[0038]在介绍本公开实施例之前首先对本公开实施例中涉及到的相关名词作如下释义:
[0039]以图搜图,以图搜图是利用图像识别技术,根据原始图片的颜色分布、几何形状、纹理等视觉特征,来搜索网络上的相似图片。
[0040]前向推理,是从知识库中的原子语句开始,并在向前方向上应用推理规则来提取更多数据,直到达到目标为止。
[0041]光学字符识别(Optical Character Recognition,OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。亦即将图像中的文字进行识别,并以文本的形式返回。
[0042]可微分二值化处理(Differentiable Binarization Network,DBNet)算法,全称可微分二本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种试题信息的提取方法,其特征在于,所述方法包括:确定带插图试题的初始试题类型、初始插图类型和插图图像;基于所述初始试题类型、所述初始插图类型和所述插图图像,获得试题特征信息,所述试题特征信息至少包括插图特征信息;基于所述插图特征信息获得试题信息。2.根据权利要求1所述的方法,其特征在于,所述确定带插图试题的初始试题类型、初始插图类型和插图图像,包括:基于带插图试题图像确定所述初始试题类型;基于所述带插图试题图像确定插图位置信息;基于所述插图位置信息从所述带插图试题中获取所述插图图像;基于所述插图图像确定所述初始插图类型。3.根据权利要求2所述的方法,其特征在于,所述基于带插图试题图像确定对应所述初始试题类型,包括:基于文本识别模型识别所述带插图试题图像的试题文本信息;基于所述试题文本信息确定所述试题文本信息含有的多个子文本的词向量;基于文本分类模型处理多个所述子文本的词向量,获得初始试题类型。4.根据权利要求2所述的方法,其特征在于,所述初始插图类型由插图类型确定模块基于所述插图图像确定,所述插图类型模块包括第一特征提取模块、移动翻转瓶颈卷积模块和第二特征提取模块,所述基于所述插图图像确定所述初始插图类型,包括:基于所述第一特征提取模块提取所述插图图像的浅层图像特征;基于所述移动翻转瓶颈卷积模块对所述浅层图像特征进行提取,获得深度图像特征;基于所述第二特征提取模块提取所述深度图像特征,获得所述初始插图类型。5.根据权利要求1所述的方法,其特征在于,所述基于所述初始试题类型、所述初始插图类型和所述插图图像,获得试题特征信息,包括:将所述初始试题类型、所述初始插图类型与所述插图图像进行拼接,获得第一插图拼接信息;将所述插图拼接信息输入插图特征提取模型,获得对应的所述插图特征信息。6.根据权利要求5所述的方法,其特征在于,所述第一插图拼接信息以矩阵形式描述,所述矩阵的宽度为W,高度为H,其中,W表示所述插图图像的宽度,H由所述插图图像的高度、试题类别号和插图类别确定。7.根据权利要求1~6任一项所述的方法,其特征在于,所述试题信息包括所述插图特征信息和插图尺寸信息。8.根据权利要求7所述的方法,其特征在于,试题特征信息包括修正初始试题类型和修正初始插图类型,所述方法还包括:将所述插图特征信息与插图尺寸信息进行拼接,获得对应的第二插图拼接信息;基于每个所述第二插图拼接信息、修正初始试题类型和修正初始插图类型确定试题信息。9.根据权利要求8所述的方法,其特征在于,所述第二插图拼接信息含有多个相同的插图尺寸信息,所述插图尺寸信息包括插图长宽比参数和/或插图图像在所述带插图试题中<...

【专利技术属性】
技术研发人员:兴百桥
申请(专利权)人:深圳市星桐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1