一种试题匹配方法及装置制造方法及图纸

技术编号:37233041 阅读:10 留言:0更新日期:2023-04-20 23:15
本公开提供了一种试题匹配方法及装置,涉及数据处理领域,尤其涉及文本数据处理技术领域。具体实现方案为:对各个试题的试题内容进行内容转换处理,得到表征各个试题的试题内容的内容参数;将各个试题对应的内容参数分割为多个子参数;对相同子参数对应的试题进行匹配,得到相似试题。应用本公开实施例提供的试题匹配方案,能够实现试题匹配。能够实现试题匹配。能够实现试题匹配。

【技术实现步骤摘要】
一种试题匹配方法及装置


[0001]本公开涉及数据处理
,尤其涉及文本数据处理
,特别涉及一种试题匹配方法及装置。

技术介绍

[0002]教育辅助平台可以获取海量的试题,并向用户提供试题,以供用户针对试题涉及的知识点进行测试、练习等。
[0003]教育辅助平台期望在用户解答平台所提供试题的过程中,为用户提供与所解答试题相似的其他试题,以辅助用户巩固试题涉及的知识点,或者在用户解题遇到困难时,为用户提供该其他试题的解题过程。
[0004]因此,需要一种试题匹配方案,以使得教育辅助平台对自身获取的试题进行匹配,得到相似试题。

技术实现思路

[0005]本公开提供了一种试题匹配方法及装置。
[0006]根据本公开的一方面,提供了一种试题匹配方法,包括:
[0007]对各个试题的试题内容进行内容转换处理,得到表征各个试题的试题内容的内容参数;
[0008]将各个试题对应的内容参数分割为多个子参数;
[0009]对相同子参数对应的试题进行匹配,得到相似试题。
[0010]根据本公开的另一方面,提供了一种试题匹配装置,包括:
[0011]内容转换模块,用于对各个试题的试题内容进行内容转换处理,得到表征各个试题的试题内容的内容参数;
[0012]参数分割模块,用于将各个试题对应的内容参数分割为多个子参数;
[0013]试题匹配模块,用于对相同子参数对应的试题进行匹配,得到相似试题。
[0014]根据本公开的另一方面,提供了一种电子设备,包括:
[0015]至少一个处理器;以及
[0016]与所述至少一个处理器通信连接的存储器;其中,
[0017]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述试题匹配方法。
[0018]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述试题匹配方法。
[0019]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述试题匹配方法。
[0020]由以上可见,应用本公开实施例提供的方案进行试题匹配时,内容参数表征试题的试题内容,将试题对应的内容参数分割为多个子参数后,各个子参数对试题也具有表征
性,这样相同子参数对应的试题可以理解为较为相似的试题,从而对相同子参数对应的试题进行匹配,能够在各个试题中准确匹配到相似试题。
[0021]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0022]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0023]图1为本公开实施例提供的第一种试题匹配方法的流程示意图;
[0024]图2为本公开实施例提供的第二种试题匹配方法的流程示意图;
[0025]图3为本公开实施例提供的第三种试题匹配方法的流程示意图;
[0026]图4a为本公开实施例提供的第四种试题匹配方法的流程示意图;
[0027]图4b为本公开实施例提供的一种确定子参数的流程示意图;
[0028]图5为本公开实施例提供的第五种试题匹配方法的流程示意图;
[0029]图6为本公开实施例提供的第六种试题匹配方法的流程示意图;
[0030]图7为本公开实施例提供的第七种试题匹配方法的流程示意图;
[0031]图8为本公开实施例提供的第八种试题匹配方法的流程示意图;
[0032]图9为本公开实施例提供的第一种试题匹配方法的流程示意图;
[0033]图10为本公开实施例提供的第二种试题匹配方法的流程示意图;
[0034]图11为本公开实施例提供的第三种试题匹配方法的流程示意图;
[0035]图12是用来实现本公开实施例的试题匹配方法的电子设备的框图。
具体实施方式
[0036]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0037]现有技术中,在对试题进行匹配时,通常采用召回和相似度计算技术进行试题匹配,即通过召回技术召回多个试题,计算所召回的两两试题之间的相似度,根据相似度确定相似试题。
[0038]例如,上述召回技术可以是倒排索引技术、ES(Elastic Search,弹性搜索)召回技术、向量召回技术等;试题之间的相似度可以是试题之间的编辑距离、余弦相似度或者其他相似度,并且可以利用相似度计算模型计算试题之间的相似度。
[0039]然而,现有技术需要计算两两试题之间的相似度,根据计算所得相似度确定相似试题,这样在试题数量较大时,进行匹配的计算量也较大,匹配效率低。
[0040]为解决上述问题,本公开实施例提供了一种试题匹配方法及装置,下面通过具体实施例进行详细说明。
[0041]参见图1,图1为本公开实施例提供的第一种试题匹配方法的流程示意图,本实施例中,上述方法包括以下步骤S101

S103。
[0042]步骤S101:对各个试题的试题内容进行内容转换处理,得到表征各个试题的试题
内容的内容参数。
[0043]其中,上述试题可以是供用户进行练习的练习题、供用户进行测试的测试题或者供用户进行参考等其他用途的题目等。
[0044]具体的,在获得多个试题后,可以提取试题的试题内容,再对各个试题的试题内容进行内容转换处理,得到上述内容参数。
[0045]本公开的一个实施例中,在提取试题的试题内容时,上述试题的试题内容可以包括以下信息中至少一种:
[0046]试题题干、试题选项、试题中的图片内容、试题公式中的字符。
[0047]在试题中存在图片的情况下,可以识别图片的图片内容,将图片内容作为试题内容。
[0048]在试题中存在公式的情况下,可以识别公式中的字符,将公式字符作为试题内容。
[0049]上述信息能够准确反映试题的试题内容,这样将上述信息中至少一种作为试题内容进行内容转换处理,能够提高所获得内容参数的准确性,进而根据较为准确的内容参数进行试题匹配,能够提高试题匹配的准确性。
[0050]本公开的一个实施例中,在进行试题匹配之前,可以对各个试题进行预处理。
[0051]例如,可以去除各个试题中试题内容重复的多余试题、试题内容清洗、试题内容标准化等。
[0052]由于涉及不同知识点的试题可能出现部分信息相同,部分信息不同的情况,例如,题本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种试题匹配方法,包括:对各个试题的试题内容进行内容转换处理,得到表征各个试题的试题内容的内容参数;将各个试题对应的内容参数分割为多个子参数;对相同子参数对应的试题进行匹配,得到相似试题。2.根据权利要求1所述的方法,其中,所述对相同子参数对应的试题进行匹配,得到相似试题,包括:根据子参数的数值,对各个试题对应的子参数进行分组,得到各个预设计算节点对应的各个参数组,其中,数值相同的子参数属于同一参数组;针对每一参数组,获得该参数组对应的计算节点对待匹配试题进行匹配得到的相似试题,其中,所述待匹配试题为:该参数组中数值相同的子参数对应的试题。3.根据权利要求1或2所述的方法,其中,所述将各个试题对应的内容参数分割为多个子参数,包括:针对每一试题,将该试题对应的内容参数分割为多个预设位数的中间参数,根据各个中间参数及各个中间参数的排列顺序,确定该试题对应的多个子参数。4.根据权利要求3所述的方法,其中,所述根据各个中间参数及各个中间参数的排列顺序,确定该试题对应的多个子参数,包括:按照各个中间参数的排列顺序,轮流确定各个中间参数所属的子参数,并将同一子参数对应的中间参数连接,得到该试题对应的多个子参数。5.根据权利要求3所述的方法,其中,所述将该试题对应的内容参数分割为多个预设位数的中间参数,根据各个中间参数及各个中间参数的排列顺序,确定该试题对应的多个子参数,包括:在存在多个所述预设位数的情况下,针对每一预设位数,将该试题对应的内容参数分割为多个该预设位数的中间参数,根据各个中间参数及各个中间参数的排列顺序,确定该试题对应的多个子参数。6.根据权利要求1或2所述的方法,其中,所述对各个试题的试题内容进行内容转换处理,得到表征各个试题的试题内容的内容参数,包括:针对每一试题,对该试题的试题内容进行局部敏感哈希simhash计算,得到该试题的simhash值,作为表征该试题的试题内容的内容参数。7.根据权利要求1或2所述的方法,其中,在得到相似试题之后,还包括:若相似试题中存在来源于解题视频的第一试题,则为各个第二试题挂载所述第一试题来源的解题视频,其中,所述第二试题为:所述相似试题中除所述第一试题外的其他试题;若相似试题中存在来源于试卷文档的第三试题,则为各个第四试题挂载所述第三试题来源的试卷文档,其中,所述第四试题为:所述相似试题中除所述第三试题外的其他试题。8.根据权利要求1所述的方法,其中,所述对相同子参数对应的试题进行匹配,得到相似试题,包括:获得相同子参数对应的试题之间的相似度;根据所获得相似度,在相同子参数对应的试题中确定相似试题。9.根据权利要求1或2所述的方法,其中,所述试题内容包括以下信息中至少一项:
试题题干、试题选项、试题中的图片内容、试题公式中的字符。10.一种试题匹配装置,包括:内容转换模块,用于对各个试题的试题内容进行内容转换处理,得到表征各个试题的试题内容的内容参数;参数分割模块,用于将各个试题对应的内容参数分割为多个子...

【专利技术属性】
技术研发人员:郑阳亓子依薛璐影吴广发
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1